AMD "Barcelona": clocks

blastarr

Power Member
Pois é, o HKEPC teve acesso às velocidades iniciais desta CPU para servidores e workstations que, como sabemos, vai inaugurar a arquitectura que sucede finalmente aos K8.

As velocidades de relógio e as datas de introdução não são nada famosas.
Antes esperava-se uma velocidade de 2.9GHz antes do final de 2007, agora só chegarão aos 2.6GHz nunca antes de Março... de 2008.



http://www.hkepc.com/bbs/itnews.php?tid=746541&starttime=0&endtime=0

Pergunto-me como é que isto se vai dar contra um Intel "Tigerton" (a versão multi-socket do sucessor do actual "Kentsfield" Core 2 QX6700/Q6600, o "Yorkfield")...
 
Última edição:
Se a arquitectura se mostrar pujante e concorrencial são valores suficientes para o "regresso"

Aliás se tiver melhor performance per clock um 2.6 deve dar para bater a intel, se bem que a intel é um alvo em movimento que ultimamente se mexe bem rápido
 
Se a arquitectura se mostrar pujante e concorrencial são valores suficientes para o "regresso"

Aliás se tiver melhor performance per clock um 2.6 deve dar para bater a intel, se bem que a intel é um alvo em movimento que ultimamente se mexe bem rápido

O problema é que a própria AMD já disse publicamente que este quad-core é 40% mais rápido do que um Opteron dual-core.

Simulations conducted in AMD laboratories indicate that certain database applications will see performance improvements up to 70 percent and certain floating point applications will experience performance gains of up to 40 percent over platforms powered by current dual-core AMD Opteron processors.

Isto, combinado com o actual diferencial de performance entre os K8 e os Core 2, e tendo aínda em conta as maiores velocidades de relógio dos cores Intel a 45nm (Tigerton, Yorkfield, Penryn, etc), bem com o aumento da cache L2 para 6 e 12MB, e aínda a introdução das instruções SSE4, pode não ser suficiente para bater o que quer que seja que a Intel tenha no mercado na segunda metade deste ano.

Se não conseguir bater a Intel, não pode justificar preços elevados.
Se não pode justificar preços altos, tem de partir para uma nova guerra de preços.
E se partir para uma nova guerra de preços, a actual situação financeira e do valor das acções pode ficar aínda mais complicada.
 
Última edição:
Para o bem de todos nós (ok, depende da perspectiva) esperemos que o blastarr esteja errado,porque senão, os consumidores finais (nós)

só têm a perder se a hegemonia da Intel se mantiver. Tenho dito.

:rcarton:
 
O problema é que a própria AMD já disse publicamente que este quad-core é 40% mais rápido do que um Opteron dual-core.

Disse que era 40 a 70% comparação core por core e em floating point era 3,4 a 3.7x superior em relação a um dual-core.
Isto é, 2x por duplicar de dual para quad-core e sobram 1.4 a 1.7x so nos improvements da tecnologia.

Isso que tas a dizer nem sequer faz o menor sentido, pq tas a dizer que o K8L vai ser pior que o K8 a nivel de arquitectura..... duplicavamos os cores que da logo so por isso 100% de vantagem e tas a dizer que isso so da 40% de vantagem sem ainda contar com os improvements da tecnologia.
basta pensar um bocadinho para perceber que 40 a 70% de improvement é em relação 1core K8 vs 1core K8L.
Em relação a dual vs quad-core dá 3.4 a 3.7x de diferença. Este 3.4 a 3.7x viram logo no 1º artigo que a AMD lançou sobre o K8L.

Para o bem de todos nós (ok, depende da perspectiva) esperemos que o blastarr esteja errado,porque senão, os consumidores finais (nós)
Sim está errado.
 
Última edição pelo moderador:
Disse que era 40 a 70% comparação core por core e em floating point era 3,4 a 3.7x superior em relação a um dual-core.
Isto é, 2x por duplicar de dual para quad-core e sobram 1.4 a 1.7x so nos improvements da tecnologia.

Isso que tas a dizer nem sequer faz o menor sentido, pq tas a dizer que o K8L vai ser pior que o K8 a nivel de arquitectura..... duplicavamos os cores que da logo so por isso 100% de vantagem e tas a dizer que isso so da 40% de vantagem sem ainda contar com os improvements da tecnologia.
basta pensar um bocadinho para perceber que 40 a 70% de improvement é em relação 1core K8 vs 1core K8L.
Em relação a dual vs quad-core dá 3.4 a 3.7x de diferença. Este 3.4 a 3.7x viram logo no 1º artigo que a AMD lançou sobre o K8L.

E também basta "pensar um bocadinho" para se perceber que a velocidade máxima de introdução do "Barcelona" é de 2.1~2.3GHz, enquanto os Opteron dual-core actuais chegam aos 2.8GHz (2220/8220).

Uma CPU é uma combinação de design e velocidade de relógio... :rolleyes:
 
Última edição pelo moderador:
Para o bem de todos nós (ok, depende da perspectiva) esperemos que o blastarr esteja errado,porque senão, os consumidores finais (nós)

só têm a perder se a hegemonia da Intel se mantiver. Tenho dito.

:rcarton:

Tudo dito!

O Blastarr está a dar uma de pessimista e alarmista, mas se estes Barcelona forem um flop, podem dizer adeus a AMD e a INTEL volta a sentar a sombra da bananeira!
 
E depois de se sentar á sombra da bananeira..ppimba... a AMD volta ao de cima...

lá está o tal ciclo novamente em acção..portanto.. qual o espanto ??

Também desde que saiu de lá o pessoal da antiga DEC e entrou o da IBM lixou-se tudo.. foi sempre a descer... mas lá está..

eles "mamam" com o pessoal da IBM pois são eles que lhes "alugam" os processos de fabrico...

pra mim, vejo duas hipóteses para um maior sucesso da AMD..

1) ou a IBM entra a sério numa joint-ventura com a AMD e colaboram tipo "unha e carne"
2) ou se distanciam de vez da IBM e avançam eles com investigação, e deixam de estar á mercê da IBM e por vezes, das más decisões deles, e de ter que aturar os chefes deles..etc..
 
E também basta "pensar um bocadinho" para se perceber que a velocidade máxima de introdução do "Barcelona" é de 2.1~2.3GHz, enquanto os Opteron dual-core actuais chegam aos 2.8GHz (2220/8220).

Uma CPU é uma combinação de design e velocidade de relógio... :rolleyes:

E depois?
Em aplicaçoes que tirem partido do multicore bem podias ter um opteron dual-core a 4.0Ghz que mesmo assim ia ficar a perder para o Barcelona (dobro dos cores, solução nativa, muitas inovaçoes em relação ao K8).

Os clocks do Barcelona estão intermédios.
O Kentsfield Quad-core também tem clocks bastante baixos. Nao se podem esperar que os quad-core tenham os clocks de um dual-core.

A Intel ate pode ter um Penrin com altos clocks e 12mb de cache, mas tal CPU vai ter um tamanho e consequentemente preço muito alto, enquanto que a AMD com uma solução nativa e menos transístores pode jogar com o preço.
Sem falar que estes CPU´s têm preços altíssimos e não se vão tornar mainstream ate pelo menos meio de 2008, inicio de 2009.

Por isso visão catrastofica e alarmista não faz sequer sentido nem sequer a consigo entender. Catastrófica é o que temos hoje..... as inovações do K8L vão coloca-lo a um nível completamente diferente do que tem neste momento. Basta dar uma olhadela á lista de melhoramentos para perceber isso.
Somando ainda versões quad core onde a AMD neste momento nem tem CPU´s.
 
E depois?
Em aplicaçoes que tirem partido do multicore bem podias ter um opteron dual-core a 4.0Ghz que mesmo assim ia ficar a perder para o Barcelona (dobro dos cores, solução nativa, muitas inovaçoes em relação ao K8).

Os clocks do Barcelona estão intermédios.
O Kentsfield Quad-core também tem clocks bastante baixos. Nao se podem esperar que os quad-core tenham os clocks de um dual-core.

A Intel ate pode ter um Penrin com altos clocks e 12mb de cache, mas tal CPU vai ter um tamanho e consequentemente preço muito alto, enquanto que a AMD com uma solução nativa e menos transístores pode jogar com o preço.
Sem falar que estes CPU´s têm preços altíssimos e não se vão tornar mainstream ate pelo menos meio de 2008, inicio de 2009.

Por isso visão catrastofica e alarmista não faz sequer sentido nem sequer a consigo entender. Catastrófica é o que temos hoje..... as inovações do K8L vão coloca-lo a um nível completamente diferente do que tem neste momento. Basta dar uma olhadela á lista de melhoramentos para perceber isso.
Somando ainda versões quad core onde a AMD neste momento nem tem CPU´s.

Não diria que os clocks do Kentsfield são baixos.
Pelo contrário.

A versão de topo QX6700 quad-core dista do dual-core de topo X6800 apenas uns escassos 266MHz (2.66GHz vs 2.93GHz).



Além disso estás a esquecer-te que as CPU's da segunda metade deste ano na Intel são feitas a 45nm, pelo que provavelmente serão bem mais pequenas do que a nova arquitectura AMD a 65nm...
BTW, quando vejo a lista de melhoramentos do K8L, practicamente só lá estão coisas já existentes na arquitectura Core 2, tirando o controlador de memória de um e a cache L2 partilhada do outro (a cache L3 partilhada não é da mesma "liga", pois a latência é muito superior à da L2, como sabemos).
 
Última edição:
Não diria que os clocks do Kentsfield são baixos.
Pelo contrário.

A versão de topo QX6700 quad-core dista do dual-core de topo X6800 apenas uns escassos 266MHz (2.66GHz vs 2.93GHz).
E a AMD com os 90nm consegue ter CPU´s com mais clocks que os Intel a 65nm (O X2 6000+ funciona a 3.0Ghz), logo essa necessidade da AMD mudar para um novo processo de fabrico não é tão importante. A AMD com os 65nm pode fazer tanto serviço quanto a Intel com os 45nm.

Além disso estás a esquecer-te que as CPU's da segunda metade deste ano na Intel são feitas a 45nm, pelo que provavelmente serão bem mais pequenas do que a nova arquitectura AMD a 65nm...
Primeiro esses CPU´s vao ser em número muito pequeno e segundo os investimentos em andar a mudar sempre para novos processos são altissimos e a AMD consegue rentabilizar muito melhor o investimento e consequentemente manter uma guerra de preços.
Também duvido que um CPU com 12mb de cache e 2 dual-core colados a 45nm seja mais pequeno que um CPU quad-core nativo com menos de metade da cache a 65nm.

BTW, quando vejo a lista de melhoramentos do K8L, practicamente só lá estão coisas já existentes na arquitectura Core 2, tirando o controlador de memória de um e a cache L2 partilhada do outro (a cache L3 partilhada não é da mesma "liga", pois a latência é muito superior à da L2, como sabemos).
Só? Bem bom.... o que existe hoje na AMD é que é muito mau em comparação com os Core2.

Sem falar que a latencia da L3 pode ser algo superior á da L2, no entanto está anos luz melhor do que do cross-bar que o Penrin vai utilizar. Os 12mb de L2 vêm tentar disfarçar esse grande problema.....
 
E a AMD com os 90nm consegue ter CPU´s com mais clocks que os Intel a 65nm (O X2 6000+ funciona a 3.0Ghz), logo essa necessidade da AMD mudar para um novo processo de fabrico não é tão importante. A AMD com os 65nm pode fazer tanto serviço quanto a Intel com os 45nm.


Primeiro esses CPU´s vao ser em número muito pequeno e segundo os investimentos em andar a mudar sempre para novos processos são altissimos e a AMD consegue rentabilizar muito melhor o investimento e consequentemente manter uma guerra de preços.
Também duvido que um CPU com 12mb de cache e 2 dual-core colados a 45nm seja mais pequeno que um CPU quad-core nativo com menos de metade da cache a 65nm.


Só? Bem bom.... o que existe hoje na AMD é que é muito mau em comparação com os Core2.

Sem falar que a latencia da L3 pode ser algo superior á da L2, no entanto está anos luz melhor do que do cross-bar que o Penrin vai utilizar. Os 12mb de L2 vêm tentar disfarçar esse grande problema.....

"Cross-bar" ?

Estás mesmo a leste...

BTW, a Intel também pode fazer muito com o processo de 65nm actual.
A prova são muitas CPU's low end, como o E4300, a dar mais de 100% de overclock a ar, algo que não se via desde o mítico Celeron 300A...
Uma CPU Core 2 que dê menos de 3.5GHz a ar (e que não esteja a ser "atrasada" pela memória RAM ou pela motherboard) é considerada uma "ave rara", hoje em dia.
Enquanto isso, o processo de 65nm SOI da AMD mal dá para chegar aos 3.0GHz com os K8 actuais, a meros meses do lançamento do K8L/K10 (com muito mais transístores).
 
Última edição:
BTW, quando vejo a lista de melhoramentos do K8L, practicamente só lá estão coisas já existentes na arquitectura Core 2, tirando o controlador de memória de um e a cache L2 partilhada do outro (a cache L3 partilhada não é da mesma "liga", pois a latência é muito superior à da L2, como sabemos).

Isso foi mais ou menos o que eu disse há uns 3 meses ou mais. O que está em jogo ao nível do CPU é a L1/shared L2 vs L1/L2, shared L3. O resto é mais ou menos igual excepto o controlador de memória integrado e o cHTT. Só que este pormenor é suficiente para que toda a gente no universo do HPC esteja à espera do "K8L" apesar de já existirem Quads da Intel há vários meses. Infelizmente para a Intel ninguém é "parvo". Vejam só como escalam os cpus da Intel.

http://uk.theinquirer.net/?article=37821

the CineBench, the scalability drop off from 318% in The Quad (nearly 80% efficiency!) to just 444% in The Oct (55% efficiency), despite exactly the same cores, twice the total cache and dual FSBs with the same CPU:FSB ratio of 8.

É ridículo ou há algo de errado no CineBench.

Enfim, esperemos pelo CSI que tarda em sair e já vêm com pelos menos 5 anos de atraso.

Já agora,

quadcoredcakb3.png


nativequadcorebenefitux2.png
 
Última edição:
Isso é tudo muito bonito em teoria, mas na práctica o FSB na arquitectura Core 2 Duo/Core 2 Quad está bem longe de atingir o limite máximo de largura de banda disponível.
A cache L2 é altamente agressiva a partilhar dados entre cada par de cores, pelo que a latência no acesso à memória é perfeitamente concorrencial com um controlador de memória integrado para DDR2.

Se é verdade que num quad-core Intel se perdem uns ciclos de relógio a aceder ao outro "par", também não é menos verdade que um único core no AMD "Barcelona" tem de potencialmente duplicar pelo menos parte do conteúdo dos outros 3 cores na cache L2 dedicada (512KB), pois a penalização por aceder à cache L3 partilhada é aínda mais forte a nível das latências.

Além disso, não esqueçamos que os actuais Intel "Clovertown" possuem dois FSB's de 1333MHz cada, e que as versões de 45nm vão aumentar esse clock para 1600MHz.

O "Kentsfield" (quad-core versão desktop da Intel) não tem problemas visíveis por apenas usar um único FSB a 1333MHz para todos os quatro cores...
 
Em Junho logo ficaremos a saber se o Barcelona escala bem ou não. Entra para o 4º lugar do TOP500 dos supercomputadores e ataca o 1º lugar lá para o fim do ano ficando provavelmente em 2º se a IBM largas mais umas massas para uns upgrades ou meter o híbrido Opteron/Cell a trabalhar.

http://www.tacc.utexas.edu/resources/hpcsystems/

Sun Constellation Linux Cluster
System Name: Ranger
Operating System: Linux
Number of Nodes: 3,288
Number of Processing Cores(Initial/Final): 26,304/52,608
Total Memory(Initial/Final): 52.6TB/105TB
Peak Performance(Initial/Final): 105TFlops/421TFlops
Total Disk: 1.73PB
Description:
TACC, in partnership with Sun Microsystems, will build a supercomputer system specifically designed to support very large science and engineering computing requirements. In its final configuration in 2007, the new supercomputer system, named Ranger, will have a peak performance in excess of 400 trillion floating point operations per second (Teraflops), making it one of the most powerful supercomputer systems in the world. It will also provide over 100 Terabytes of memory and 1.7 Petabytes of disk storage. The system is based on next-generation Sun blade servers using AMD's forthcoming quad-core processors. The Ranger system will be housed in TACC's new building on the J.J. Pickle Research Campus in Austin, Texas.
The system will enter initial production on June 2, 2007.
 
Última edição:
Se é verdade que num quad-core Intel se perdem uns ciclos de relógio a aceder ao outro "par", também não é menos verdade que um único core no AMD "Barcelona" tem de potencialmente duplicar pelo menos parte do conteúdo dos outros 3 cores na cache L2 dedicada (512KB), pois a penalização por aceder à cache L3 partilhada é aínda mais forte a nível das latências.

Não, nao tem que replicar nada. Por isso é que é um quad-core nativo.
A cache L3 serve para partilhar dados por todo os 4 cores. Nao fazia sequer sentido andar a replicar tudo em todas as L2.... para isso retirava-se a cache L3 que nao ta lava la a fazer nada.
A latencia é a que é e é assim que o cpu trabalha.

Para além do mais não conheces sequer as latências de acesso á cache L3. Logo não vale a pena mais prognósticos catastrofistas também sobre isso.

Alias o 2º slide demostra isso mesmo. Num Barcelona um core acede ao outro através da L3 de forma rapidíssima por que é tudo feito dentro do CPU. A solução da Intel comparada com a da AMD é andar de cavalo para burro a nível de latências.
 
Última edição:
Não, nao tem que replicar nada. Por isso é que é um quad-core nativo.
A cache L3 serve para partilhar dados por todo os 4 cores. Nao fazia sequer sentido andar a replicar tudo em todas as L2.... para isso retirava-se a cache L3 que nao ta lava la a fazer nada.
A latencia é a que é e é assim que o cpu trabalha.

Para além do mais não conheces sequer as latências de acesso á cache L3. Logo não vale a pena mais prognósticos catastrofistas também sobre isso.

Alias o 2º slide demostra isso mesmo. Num Barcelona um core acede ao outro através da L3 de forma rapidíssima por que é tudo feito dentro do CPU. A solução da Intel comparada com a da AMD é andar de cavalo para burro a nível de latências.

A Cache L3 é mais lenta que a cache L2... Acho que isso está mais que evidenciado... De homem era unir os 4 cores com a cache L2 e não com a L3.

Uma coisa é certa, vai funcionar melhor na Intel, o core 1 acedir ao core 2 e vice versa, e o Core 3 aceder ao core 4 e vice versa que na AMD. Pois usam a cache L2 mais rápida. Tranferencias entre outros cores é mais rápido para a AMD.


Mas não me acredito que a diferença va´estar ai, vai sim estar na arquitectura dos cores e na sua velocidade de Relógio.


Quando o K8L chegar, qual irá ser o CPU da Intel que estará cá?
 
A Cache L3 é mais lenta que a cache L2... Acho que isso está mais que evidenciado... De homem era unir os 4 cores com a cache L2 e não com a L3.

Uma coisa é certa, vai funcionar melhor na Intel, o core 1 acedir ao core 2 e vice versa, e o Core 3 aceder ao core 4 e vice versa que na AMD. Pois usam a cache L2 mais rápida. Tranferencias entre outros cores é mais rápido para a AMD.

Pois entre cada par de dual cores na Intel a coisa mexe-se muito rápido, mas no entanto nao te podes esquecer dos 2 cores vizinhos. Porque isto é um quad core e nao um dual core.

Enquanto que na AMD tens um sistema uniforme em que esta tudo mais ou menos uniformizado á mesma velocidade entre qualquer transferencia de dados, no caso da Intel tanto tens picos muito rapidos, como tens que tar uma eternidade á espera e na informática regra geral o sistema mais lento limita o sistema mais rápido.
Tal como se tu fizeres um upgrade para ram DDR-266 quando ja tens DDR-400, a DDR-400 vai ficar limitada á velocidade da DDR-266.

Se pegares num programa altamente paralelizavel como o cinebench vai acontecer aquilo que o Ajax mostrou com uma taxa de eficiência muito mais baixa que aquilo que seria de esperar.
 
Não, nao tem que replicar nada. Por isso é que é um quad-core nativo.
A cache L3 serve para partilhar dados por todo os 4 cores. Nao fazia sequer sentido andar a replicar tudo em todas as L2.... para isso retirava-se a cache L3 que nao ta lava la a fazer nada.
A latencia é a que é e é assim que o cpu trabalha.

Para além do mais não conheces sequer as latências de acesso á cache L3. Logo não vale a pena mais prognósticos catastrofistas também sobre isso.

Alias o 2º slide demostra isso mesmo. Num Barcelona um core acede ao outro através da L3 de forma rapidíssima por que é tudo feito dentro do CPU. A solução da Intel comparada com a da AMD é andar de cavalo para burro a nível de latências.

Um core acede ao outro... através da cache L1, através da cache L2, através da cache L3 e, no caso de uma motherboard multi-socket, através do controlador Hypertransport para a segunda CPU, em ordem decrescente.
Assim, os dados são replicados, porque a cache L3 é externa a cada um dos quatro cores, a penalização é sempre muito superior.

A prova de que não é uma parte intrínseca da arquitectura é que estão previstos cores K8L sem qualquer memória cache L3, mesmo sem ser no low-end...
 
Back
Topo