Zealot,
"Que são muito MUITO melhores que os compiladores da Micro$oft!
Para Pentium 4, claro."
melhor que o compilador da Microsoft e melhor que
o compilador GNU CC.
Mas... olha que é errado pensar que só é bom para
Pentium 4.
Já deves ter lido que código compilado pelo compilador Intel
corre mais rapidamente em Athlons do que outros compilados
por outros compiladores.
Eis um exemplo de um programa meu que cabe praticamente
na cache quer de um Athlon quer de um Pentium 4 e que
faz cálculos repetitivos (integrador). Em modo benchmark
(sim, todos os meus códigos tem uma opção benchmark
)
Gcc 3.2:
jorge@calc files $ ./rayon_g++
Benchmark!
Precision: 1e-12
CPU time : 9.59 seconds
CPUMark : 1.82
--------------------------------------------------------
Athlon 1.2Ghz / 512 MB RAM / KT133A -> CPUMark = 1.0
--------------------------------------------------------
Intel CC 7.1:
jorge@calc files $ ./rayon_icc
Benchmark!
Precision: 1e-12
CPU time : 6.01 seconds
CPUMark : 2.91
--------------------------------------------------------
Athlon 1.2Ghz / 512 MB RAM / KT133A -> CPUMark = 1.0
--------------------------------------------------------
compilados com as melhores optimizações e
executados num Athlon MP 1900+ (só 1 cpu).
O compilador da Intel é neste caso 60% mais rápido.
Portanto, é preciso ter muito cuidado quando se compara
CPUs e como se faz esse benchmark.
Por curiosidade, o mesmo programa compilado pelo ICC
num Pentium 1700 Mhz (Willy, 256KB cache) dá:
jorge@alpha files $ ./rayon_icc
Benchmark!
Precision: 1e-12
CPU time : 6.73 seconds
CPUMark : 2.59
--------------------------------------------------------
Athlon 1.2Ghz / 512 MB RAM / KT133A -> CPUMark = 1.0
--------------------------------------------------------
Ou seja, pouco mais lento que um Athlon 1900+.
Dá que pensar não é? Quando se controla o processo
de benchmarking as coisas tornam-se mais complexas
e surpreendentes.
Este excelente resultado num Pentium 4 comprova o
facto de muita gente no mundo cientifíco andar a passar
dos Athlons para Pentiuns 4 mas... é preciso ter cuidado
especialmente com as SSE2. ahhh e dá trabalho.
Este programa em particular está optimizado à mão
ao nível da preparação para paralelização de alguns ciclos
mais complicados.