Processador AMD APUs Kaveri

Eu estava à espera de mais ganhos nos APU de menor consumo e não nos de topo.

Mesmo nos slides da AMD durante a apresentação, aos quais é preciso adicionar sal, os ganhos são mais evidentes nos APU de menor consumo, vejam o PC Mark 08 e 3D Fire Strike que foi postado pelo user eblain ainda no tópico AMD
http://forum.zwame.pt/showthread.php?t=753546&page=37&p=11105145&viewfull=1#post11105145

Esperar por reviews clock vs clock para ver os ganhos.
Em relação aos testes em OpenCL e sendo este o primeiro APU com as implementações HSA era de esperar um salto na performance.
 
A AMD tambem não prometeu muito, eles prometeram 20% em IPC e 30% no IGP
O IGP será o mais facil dado à arquitectura da gráfica.

O CPU vai ser mais complicado, mas como já foi dito aqui, os ganhos possivelmente não se vão notar grande coisa quando comparado de um A10-6800K que vem com turbo a 4.4 vs um A10-7850K que vem clockado com turbo a 3.9 ou 4.0.
Sinceramente a melhoria do consumo acredito que nem seja 5w sequer quando testado à séria, mas sem dúvida que seria muito agradável que os 20% em IPC fossem conseguidos.
Quanto à review espanhola, se aquela cache tem aquela velocidade, então é uma grande evolução.

Cumps..

EDIT: Estive a reparar numa coisa no cinebench R11.5.
Segundo o Tom'sHardware o A10-6800K tinha um performance per core de 1.13 e 3.58 em multithreading
O que dava um aproveitamento de 3.23/4 cores nos testes.

Segundo os resultados do Espanhol e pelo que já tive oportunidade de ver neste site

74e3fb03b40247dbb75f12ef76988a84-635x476.jpg


Fonte

Que condiz exactamente com o bench do espanhol

vgno.jpg


7vps.jpg


Fonte

O resultado que vemos é que o aproveitamento destes 4 cores é de 3.53x/4 que é fantástico, mas por outro lado se fizermos as contas ao cinebench R11.5
Ou seja o resulto MT/MP=SP (Multithreading/Multiplier=Single Thead) <=> 3.58/3.53= 1.01

Chegamos à conclusão a julgar pela leak que o performance Single Thread à frequência que ele vem (Stock) é de 1.01 enquanto o A10-6800K é de 1.13
Por outro lado clock per clock, olhando para o bench do espanhol temos o resultado de 4.26/3.53= 1.21 contra os 1.13 do A10-6800K ao mesmo clock

O que conclui que core-per-clock existe um aumento de 7.01% ao invés dos prometidos 20% :D
 
Última edição:
Pelo que dá a entender, a descida da frequência anula os ganhos que o Kaveri traria sobre os Richland no CPU.
Francamente não percebo a AMD. Se é esse o caso não valeria mais a pena manterem as freqs. mais elevadas para se notar mais os ganhos?
Aposto que quando o Haswell sair vão fazer um refresh ao Kaveri com aumentos de clocks e um rebrand só para disfarçar.

Mas se não houver melhorias por aí além também se percebe forque não fazem refresh dos FX com arquitectura Kaveri porque pelos vistos as melhorias são nulas.
 
O que vejo é que as melhoras em single core performance não são grandes, mas que o performance entre os cores melhorou bastante, adicionalmente o que mais se destaca ainda é a cache.
Tudo isto em conjunto faz aquela excelente diferença de performance entre os modelos mais antigos.

Eles na minha opinião não subiram as frequências de maneira a manter TDP baixo.
O espanhol disse que para ter o core clock a 4.55GHZ por exemplo teve de mandar a voltagem para 1.5v para lá chegar por isso acredito que os consumos e temperaturas iriam ser defacto muito elevados.
E que pelo menos com o APU a 95W e a 3.7/4.0 consegue fazer igual ou melhor trabalho que o A10-6800K a 4.1/4.4.

Isto acaba por ir ajudar bastante tambem no mercado portatil.
A outra dúvida que acaba por ficar por preencher é os melhoramentos que eles querem fazer com os excavators para o ano, e se realmente os novos APU para o ano vão trazer os excavators.
Isto porque salvo erro os Richland e os outros anteriores usaram ambos o vishera.

Cumps..
 
Última edição:
Por partes:

- novo processo de fabrico 28nm Bulk vs 32nm PD-SOI, já tinha dito algures que iria penalizar a performance, mas a GF tem habitualmente "margem de progressão" para espremer mais uns MHz à medida que vai dominando o processo.

- essa é provavelmente a explicação para o FX se manter no processo de fabrico de 32nm, poderiam eventualmente "portar" o core Steamroller dos 28nm (do Kaveri) para os 32nm, mas isso iria obrigar a refazer as "mask" e avaliando os custos mais valia estar quieto.

@ ObscureAngel


- em relação aos Excavators é possível ver algumas coisas, por causa das submissões de patches do GCC
The attached patch (bd4-enablement.patch) enables the next version of AMD's core.
New addition to the ISA (AVX2 and BMI2) are enabled for the new core.
Presently, the tuning is mostly copied from bdver3. This includes the pipeline modeling too.
http://gcc.gnu.org/ml/gcc-patches/2013-11/msg01237.html

bdver1 = Bulldozer
bdver3 = Steamroller
bdver4 = Excavator
 
Estes ainda nem saíram e já falam nos exacavators? Com calma malta!
Para ser franco como os exacavators ainda são um refinar da arquitectura Bulldozer não estou á espera de nada de jeito.

Esperemos que a próxima arquitectura deles não seja este desastre.
 
O problema da arquitectura bulldozer na minha opinião sempre foi a questão dos módulos, mas isso está quase resolvido, o Multiplier está a 3.52x pelas leaks, ou seja um quad core com aproveitamento de 3 cores e meio.
Se fores a ver um i5 haswell tem um multiplier sobre os core de 3.87x e já teve pior nos outros anteriores.
A cache L1 e L2 está agora com enormes boosts.

Ou seja agora estão a ficar bons, o que está mal é efectivamente o performance per core, e isso tanto fazia ser a arquitectura FX como a Phenom II os valores do Performance per core está semelhante.
Por isso, o melhor a fazer agora não é mudar de arquitectura quando ela está a ficar boa, mas sim continuar a refinar o que está mal.

Os Phenoms II estavam a ficar bastante bons e lembraram-se de mudar a arquitectura e deu nisto, uma carrada de revisões para corrigir coisas erradas com o mesmo.
 
Fiquei um pouco desapontado com aqueles benchmarks em jogos que demonstram limitação por parte do CPU. :(
Mas no comparativo com o i3+HD7750 DDR5 nem se portou mal.

Estou curioso para saber o aumento de consumo com o overclock. Overclockado até fica bastante engraçado. Mas acho que o melhor a fazer será esperar por um polimento dos Kaveri (tal como os Richland foram um polimento dos Trinity). Daqui por um ano não me admirava que lançassem algo com GDDR5 integrado.
É pena é não irem substituir os FX-8350 por uma versão Kaveri.
 
Não sabemos se para o ano vão polir o kaveri, o mais provável é enfiarem logo com o excavator.

Quanto aos comparativos de CPU com a HD 7950, mostra bem o salto de um para o outro, e não me deixa triste.
Quero ver é esse teste com um i3 ao lado.

Está aqui então mais uns leaks, supostamente com umas drivers arranjadas meio ao biscate.

u0th.jpg
xvd9.jpg

hfdn.jpg


6mqo.jpg
5so3.jpg
wgv1.jpg
yyjf.jpg
hvo3.jpg
6chz.jpg
i0rd.jpg
7ynf.jpg
hnd1.jpg
n48c.jpg
w9ur.jpg
bgs4.jpg
6rhs.jpg
whq5.jpg
5sp4.jpg
woam.jpg
wrhi.jpg
7cif.jpg
kcpw.jpg


Fonte: O espanhol :P
 
Última edição:
Ainda se vê ali um bottleneck do CPU.
Mas estou bastante curioso com o overclock que ele fez? Será que aumentou muito os consumos?
E o facto é que em muitos dos benchmarks deu um salto bastante significativo sobre o A10-5800K.

Podia ser melhor mas não está nada mal. Concordo com o que diz o espanhol. Já estava na horinha de apostar em GDDR5 integrada...
Espero que daqui a meio ano lancem uma versão revista mais potente com GDDR5.

Acho que isto já está a chegar ao ponto em que podiam lançar um octa-core com um IGP tipo HD7870 ou 7950 com 2/4Gb de GDDR5 integrada. :P
 
Era bom, mas técnicamente quase impossível.
Alem demais com uma 7870 iam precisar de mais CPU, com aquela gráfica está equilibrado.
Gostava era de ver os APU's pro ano com DDR IV
 
Era bom, mas técnicamente quase impossível.
Alem demais com uma 7870 iam precisar de mais CPU, com aquela gráfica está equilibrado.
Gostava era de ver os APU's pro ano com DDR IV

Técnicamente não vejo porque seria impossível se tivesse GDDR5 incorporado.
E mesmo com DDR4 acredito que passe a ser possível porque deixar de haver as limitações da DDR3.
 
Imagina o consumo dentro de um só socket.
Fora a brutidade de aquecimento dentro do APU, foi possivel na PS4 e Xbox one, mas não foi algo feito dos pés para as mãos.
 
E GDDR5 soldada onboard ? O principal problema penso que seria o CPU reduzir desempenho com as latências de GDDR. A GDDR tem largura de banda maior mas latência também é maior. Isso para os workloads de uma consola não é grave, mas para um PC imagino que tivesse efeitos negativos em tudo o que não é jogos.
E se separarem DDR3 para o CPU e GDDR5 para o GPU então vão destruir o huma e de alguma forma também o HSA imagino...
 
Última edição:
Queria dizer com interface para GDDR5. Além da limitação de largura de banda do DDR3, existe mais alguma razão técnica para a AMD não criar um APU com um GPU e um CPU mais potentes?

A primeira razão e mais importante será a do próprio processo de fabrico em si.
Os processos de fabrico baseados no SOI permitem (em teoria) os benefícios de um half-node shrink, seja diminuindo os consumos (mantendo a velocidade) ou aumentando as velocidades (mantendo o consumo).
http://www.soiconsortium.org/fully-...imauchi - SoC Differentiation FDSOI Japan.pdf

A AMD passou de um 32nm PD-SOI para um 28nm bulk, ou seja de 32 para 28 é um half node shrink, mas passou de um processo baseado em SOI para um Bulk, o que na teoria anula os ganhos anteriores, e olhando para o resultado não anda longe da teoria.

Ainda não se sabe nada dos 20nm da GF, mas é possível que a GF ou a AMD licenciem os 28nm FD-SOI, mas isso apenas deverá acontecer com o sucessor, talvez daí o leak apresentar o Carrizo com os 65w top.


Em relação à memória, mesmo o sucessor do Kaveri não deverá trazer novidades, o leak ainda apresentava o Carrizo com FM2+ e DDR3.

Não há qualquer hipótese de memória vir na motherboard, a única hipótese seria algum tipo de embedded RAM, como acontece em alguns casos em CPU da IBM, Intel, da XBox1, mas não me parece.
A alternativa é stacked RAM, no mesmo die do APU, que não é neste momento hipótese devido ao custo e aos yields.
http://www.i-micronews.com/news/TSV-stacked-memory-closer-look,11163.html

A AMD já tinha anunciado uma parceria com a Hynnix para o HBM, inicialmente para as gráficas.
http://sites.amd.com/us/Documents/TFE2011_006HYN.pdf
 
As memórias GDDR5 têm latências superiores às DDR3 o que, apesar da largura de banda extra ser benéfica para o GPU, o mesmo já não se pode dizer para o CPU.

Para além disso o controlador de memória é mais complexo e com mais pin-outs para gerir mais canais de memória (admitindo uma configuração usual de 256-bit) o que encarece tanto o CPU como a motherboard.

Para já a escolha mais acertada é DDR3, deixar DDR4 para outras núpcias e esquecer para já GDDR neste tipo de produtos.
 
As memórias GDDR5 têm latências superiores às DDR3 o que, apesar da largura de banda extra ser benéfica para o GPU, o mesmo já não se pode dizer para o CPU.

Para além disso o controlador de memória é mais complexo e com mais pin-outs para gerir mais canais de memória (admitindo uma configuração usual de 256-bit) o que encarece tanto o CPU como a motherboard.

Para já a escolha mais acertada é DDR3, deixar DDR4 para outras núpcias e esquecer para já GDDR neste tipo de produtos.

E porque não avançarem para uma construção tipo MCM ? Elimina-se o problema dos yields, reduz-se o custo (menor quantidade porque seria o IGP a usa-la e não o CPU), e não se interfere com a quantidade de RAM do sistema, que continua susceptível a alteração.

No fundo seria algo do género de uma eDRAM, mas mais lenta e com maior espaço. Diria que uns 256MB já davam um boost significativo na performance do IGP sem aumentar o custo catastroficamente.
 
Posso estar a interpretar essa imagem de forma errada, mas o IGP tem, de facto, uma ligação conjunta à memória do sistema com o CPU, mas também uma ligação individual (segunda linha vermelha ligada a Physical Memory). Se assim for daria para o IGP ter acesso exclusivo à GDDR5, e quando precisa-se de algo extra utilizaria a memória do sistema, através da ligação unificada.

Mas posso estar a interpretar mal o diagrama.
 
Back
Topo