NVIDIA Reports Record Revenue, 36 percent increase..

Ansatsu · 10 de Agosto de 2007

ToTTenTranz disse:
Errado. Fusion é CPU + GPU.

E para 90% do mercado, Fusion = "Adeus GPU, adeus IGP". Só não vê isso quem não quer.
A Intel vai pelo mesmo caminho, o que deixa a nVidia com o High End e os telemóveis. Mas isso já todos sabemos.

Mas que falta de visão..
Qualquer pessoa que acompanhe os avanços e caminhos sabe que o futuro está num único chip com múltiplos cores optimizado para todo o tipo de funções. A chave está na eficiência máxima dos transístores e gates dos CIs de modo a obter melhor performance/watt.
Mas falamos daqui a 5 anos. Veremos onde é que está a nVidia nessa altura.

Mas que futuro estamos a falar?
Se é daqui a 1-3 anos, tens razão.
Para 4-5 anos, se calhar já podes riscar daí o mid-end.
E high-end é o quê? 3% do mercado de PCs? Nem a ATI nem a nVidia conseguiriam sobreviver sem as receitas do low e mid end para cobrir as despesas de R&D do High End.

Daqui a 5/6 anos, se calhar os mid end já andam com GDDR 256/512 Bits e com memorias ultra rápidas, pois o GDDR sempre foi mais rápido que o DDR.

Neste momento qualquer mid-end tem mais largura de banda do que o CPU tem á memoria RAM, mas muito mais mesmo. E a evolução vai continuar a ser igual.

E depois não é só isso, é que ter o CPU e o GPU a lutarem ambos pela mm memoria ram, o que vai fazer é dividir a largura de banda pelos dois, o que ainda limita mais.

Zar0n · 10 de Agosto de 2007

Ansatsu disse:
Daqui a 5/6 anos, se calhar os mid end já andam com GDDR 256/512 Bits e com memorias ultra rápidas, pois o GDDR sempre foi mais rápido que o DDR.

Neste momento qualquer mid-end tem mais largura de banda do que o CPU tem á memoria RAM, mas muito mais mesmo. E a evolução vai continuar a ser igual.

E depois não é só isso, é que ter o CPU e o GPU a lutarem ambos pela mm memoria ram, o que vai fazer é dividir a largura de banda pelos dois, o que ainda limita mais.

Nada k QuadChannel DDR3-1600 n resolva.

E ao contrario dos GPU's o Fusion n fica limitado pela largura de banda do PCI-E

lohka_86 · 10 de Agosto de 2007

Zar0n disse:
Nada k QuadChannel DDR3-1600 n resolva.

E ao contrario dos GPU's o Fusion n fica limitado pela largura de banda do PCI-E

Qual é o GPU que está limitado pela largura de banda PCI Express X16?

BTW, o Fusion não fica limitado pela LB porque ele próprio é limitado?

blastarr · 10 de Agosto de 2007

Zar0n disse:
Nada k QuadChannel DDR3-1600 n resolva.

E ao contrario dos GPU's o Fusion n fica limitado pela largura de banda do PCI-E

Por onde é que os dados do disco rígido e drive de DVD passam para a placa gráfica ? PCI ou PCI-Express.

Zar0n · 10 de Agosto de 2007

blastarr disse:
Por onde é que os dados do disco rígido e drive de DVD passam para a placa gráfica ? PCI ou PCI-Express.

Estava a falar no acesso k os GPU's fazem à ram do sistema via PCI-E. (HM ou TC)

Para o resto o PCI-E n é bottleneck.

AMD PR:
New Fusion, One chip to rule them all.

blastarr · 10 de Agosto de 2007

Zar0n disse:
Estava a falar no acesso k os GPU's fazem à ram do sistema via PCI-E. (HM ou TC)

Para o resto o PCI-E n é bottleneck.

AMD PR:
New Fusion, One chip to rule them all.

Hypermemory ou Turbocache, duas tecnologias que já nem são usadas no Vista (que virtualiza esses recursos), e que estão limitadas à low-end absoluto do mercado discrete e IGP.
Right...

Zar0n · 10 de Agosto de 2007

blastarr disse:
Hypermemory ou Turbocache, duas tecnologias que já nem são usadas no Vista (que virtualiza esses recursos), e que estão limitadas à low-end absoluto do mercado discrete e IGP.
Right...

Agr e pk é k essas maravilhosas tecnologias estão limitadas ás low end?

blastarr · 10 de Agosto de 2007

Zar0n disse:
Agr e pk é k essas maravilhosas tecnologias estão limitadas ás low end?

Porque a largura de banda real de um bus PCI-Express x16 é irrisória quando comparada com a largura de banda dedicada de placas com bus de 128bit ou superior.
Só iria criar latência no sistema, com a GPU e a GDDR3/GDDR4 à espera dos dados da RAM DDR2/DDR3, ambas muito mais lentas.

Não é coincidência só existirem em IGP's ou então em placas com bus dedicado de 32 ou 64bit...

Zar0n · 10 de Agosto de 2007

blastarr disse:
Porque a largura de banda real de um bus PCI-Express x16 é irrisória quando comparada com a largura de banda dedicada de placas com bus de 128bit ou superior.
Só iria criar latência no sistema, com a GPU e a GDDR3/GDDR4 à espera dos dados da RAM DDR2/DDR3, ambas muito mais lentas.

Não é coincidência só existirem em IGP's ou então em placas com bus dedicado de 32 ou 64bit...

Ora ai está n se pode comparar a largura de banda e latência do HM/TC com a de um controlador de memoria incluido por ex. no A64.
Na altura do fusion deve ser DDR3-1600 e com um hipotético Quad Channel podia aspirar a algo bem melhor k low end.

Conclusão: Fusion != IGP+CPU

Ansatsu · 11 de Agosto de 2007

Zar0n disse:
Ora ai está n se pode comparar a largura de banda e latência do HM/TC com a de um controlador de memoria incluido por ex. no A64.
Na altura do fusion deve ser DDR3-1600 e com um hipotético Quad Channel podia aspirar a algo bem melhor k low end.

Conclusão: Fusion != IGP+CPU

E nessa altura, que memorias GDDR não irão existir? Talvez GDDR5 não?

Imagina que tens um Quad Channel, que só por si já deve ficar bem caro. 1º e em teoria, esse quad channel divia-se a meio para o CPU e para o GPU. Ou seja, dual channel para cada um.

Agora vai ver a largura de banda disponível numa GDDR a 256 bits, nem é preciso mais. E esse dual channel.

Mas eu ate te dou uma ajuda, um slot de memoria ram DD3 1600 tem uma largura de banda de 12.80 GB/s. Em dual Channel teria 26 GB/s.
Já reparaste no valor irrisório que isso é quando comparado com o acesso ao GDDR ne? E o GDDR está a evoluir constantemente, e além de se evoluir em velocidade, também evoluem no bus, de 128, para 512, e daqui uns 2/3 anso se calhar já estamos nos 1024bits.

Zar0n · 11 de Agosto de 2007

Ansatsu disse:
Imagina que tens um Quad Channel, que só por si já deve ficar bem caro. 1º e em teoria, esse quad channel divia-se a meio para o CPU e para o GPU. Ou seja, dual channel para cada um.

Imagino k n seja assim, mas k o controlador de memoria (k serve tanto para o GPU como para o CPU) tem um load balancer dinâmico.

Dps tens k ter em conta k ainda ha graficas no mercado com DDR1 e vê ao tempo k já sairam.

Mesmo a 8500 GT usa DDR2@800 MHz, e isso é uma mid end, e já tens DDR3 nas MB hj end dia.

E o Fusion n é para destronar High end logo nem sei para k fazem essas comparações.

E a largura de banda da memoria n é factor limitativo das gráficas hj em dia, tens mt's mais ganhos a fazer OC ao GPU do k as memorias.

Outras pista (já k o fusion é para low/mid end), ve a implementação da asus com DDR3 soldada na MB e a performance k podem garantir só por isso.
Agr isso é só a asus, mas imagina k o suporte vinha da AMD, os ganhos em latências e largura de banda iam ser enormes, já k ambiente era mt mais controlado permitindo espremer o máximo de cada chip.
E para low/mid end o factor upgrade n é importante.

Conclusão:
O problema n é a memoria, mais grave é conseguir por SP's em quantidade para ser uma mid end com um consumo e preço razoável.
E k OEM n kerem performance, querem é preço baixo, logo teram k haver varias versões com combinações diferentes de CPU/GPU, e versões sem GPU para servidores etc.

Logo em termos de inventário vai ser bastante complicado.

blastarr · 11 de Agosto de 2007

Zar0n disse:
Imagino k n seja assim, mas k o controlador de memoria (k serve tanto para o GPU como para o CPU) tem um load balancer dinâmico.

Dps tens k ter em conta k ainda ha graficas no mercado com DDR1 e vê ao tempo k já sairam.

Mesmo a 8500 GT usa DDR2@800 MHz, e isso é uma mid end, e já tens DDR3 nas MB hj end dia.

E o Fusion n é para destronar High end logo nem sei para k fazem essas comparações.

E a largura de banda da memoria n é factor limitativo das gráficas hj em dia, tens mt's mais ganhos a fazer OC ao GPU do k as memorias.

Outras pista (já k o fusion é para low/mid end), ve a implementação da asus com DDR3 soldada na MB e a performance k podem garantir só por isso.
Agr isso é só a asus, mas imagina k o suporte vinha da AMD, os ganhos em latências e largura de banda iam ser enormes, já k ambiente era mt mais controlado permitindo espremer o máximo de cada chip.
E para low/mid end o factor upgrade n é importante.

Conclusão:
O problema n é a memoria, mais grave é conseguir por SP's em quantidade para ser uma mid end com um consumo e preço razoável.
E k OEM n kerem performance, querem é preço baixo, logo teram k haver varias versões com combinações diferentes de CPU/GPU, e versões sem GPU para servidores etc.

Logo em termos de inventário vai ser bastante complicado.

Esse é outro dos problemas.
Já se sabia há muito que o controlador de memória dos Athlon 64 é a principal limitação no OC a essa mesma CPU.
A velocidade escala com o resto do chip, logo, atrasa-o (a memória RAM é muito mais lenta do que uma CPU de há vários anos a esta parte).

Outro problema:
Balanceamento de carga no controlador não é algo que seja compatível com uma GPU e com um IGP de forma ideal.
As loads típicas são completamente diferentes.
Ou seja, terás 4 ou 8 cores x86 + uma dezenas de shaders/ROP's a debater-se para aceder à limitada largura de banda de um controlador dual ou triple channel DDR2/DDR3.

Porque é que achas que o "Barcelona" terá um controlador de memória desacoplado dos PLL's que controlam a velocidade de relógio dos quatro cores de execução ?

A memória onde se guarda o front-buffer e o z-buffer não está armazenada localmente (é para isso que servia essencialmente o esquema Turbocache/Hypermemory, onde a reduzida memória dedicada cumpria esse papel, enquanto o resto -a RAM do sistema- armazenava a geometria e as texturas).
Em vez disso está bem distante do controlador, tendo os dados de passar pela motherboard e depois pelo PCB do DIMM até chegar às células dentro de cada chip propriamente dito.

A memória RAM é o principal bottleneck actual (sem contar com os sistemas mecânicos dos discos rígidos e drives DVD, ou dos chips de Flash ROM).
Quanto mais longe do controlador, pior.

Daí que a Intel, a IBM e a AMD estejam a desenvolver memória RAM integrada directamente numa layer da CPU, acedida por interconnects verticais.
Pensa nela como uma versão mais avançada do esquema de RAM local (256KB) para cada core SPE do CELL, ou do que o esquema de memória GDDR3 no mesmo package da GPU (como o RSX e também várias soluções mobile da Nvidia e da ATI).

Zar0n · 11 de Agosto de 2007

blastarr disse:
Outro problema:
Balanceamento de carga no controlador não é algo que seja compatível com uma GPU e com um IGP de forma ideal.
As loads típicas são completamente diferentes.
Ou seja, terás 4 ou 8 cores x86 + uma dezenas de shaders/ROP's a debater-se para aceder à limitada largura de banda de um controlador dual ou triple channel DDR2/DDR3.

Sendo difícil ou n, axo k uma solução em k simplesmente dividem o BUS em 2 era terrivelmente ineficaz logo axo k a solução tem k passar por um load balancer, e isso até ja existe para os varios cores do CPU.

blastarr disse:
Porque é que achas que o "Barcelona" terá um controlador de memória desacoplado dos PLL's que controlam a velocidade de relógio dos quatro cores de execução ?

Segundo a AMD é ao contrario eles ao dividir as power lanes podem fazer OC ao controlador de memoria assim como fazer underclock durante cálculos intensivos k n necessitem de acesso rápido a RAM.

blastarr disse:
A memória onde se guarda o front-buffer e o z-buffer não está armazenada localmente (é para isso que servia essencialmente o esquema Turbocache/Hypermemory, onde a reduzida memória dedicada cumpria esse papel, enquanto o resto -a RAM do sistema- armazenava a geometria e as texturas).
Em vez disso está bem distante do controlador, tendo os dados de passar pela motherboard e depois pelo PCB do DIMM até chegar às células dentro de cada chip propriamente dito.

A memória RAM é o principal bottleneck actual (sem contar com os sistemas mecânicos dos discos rígidos e drives DVD, ou dos chips de Flash ROM).
Quanto mais longe do controlador, pior.

E lah está o Fusion está mt mais "perto" da RAM k ***** IGP da actualidade.

blastarr disse:
Daí que a Intel, a IBM e a AMD estejam a desenvolver memória RAM integrada directamente numa layer da CPU, acedida por interconnects verticais.
Pensa nela como uma versão mais avançada do esquema de RAM local (256KB) para cada core SPE do CELL, ou do que o esquema de memória GDDR3 no mesmo package da GPU (como o RSX e também várias soluções mobile da Nvidia e da ATI).

O problema disso é sempre o mesmo, custo de fabrico e licenças.
Basta ver o exemplo da Rambus, embora haja soluções melhores axo k vão tentar esticar no PC a DDR pelo maximo tempo possível.

NVIDIA Reports Record Revenue, 36 percent increase..

Ansatsu

Power Member

Zar0n

Power Member

lohka_86

Banido

blastarr

Power Member

Zar0n

Power Member

blastarr

Power Member

Zar0n

Power Member

blastarr

Power Member

Zar0n

Power Member

Ansatsu

Power Member

Zar0n

Power Member

blastarr

Power Member

Zar0n

Power Member