Processador AMD ZEN4 (Ryzen 7000 series)

A L3 vai aumentar claro, a estrutura pode ser 2 CCX de 8 cores por die, com um total de 64 MB L3. Não deve aumentar a L3 por core, mas nunca se sabe.

mas se aumentar a L2 e L3 por core + AVX512 e afins, o aumento de transistores por core vai anular o encolhimento para 5nm. Até pode existir single CCX de 12C.

Agora L2 de 1.25MB? Já não se via isso desde o core 2 duo (que chegou a ter 3MB por core, mas não existia L3):D
 
:offtopic: Que giro.

1-630-39e2659b.png


2-630-6c967baa.png

http://www.freepatentsonline.com/10698472.pdf

Patent: Instruction subset implementation for low power operation - AMD
Basically, AMD BIG.little.
https://twitter.com/Underfox3/status/1292124575824777217

E onde é que estão os little?
Será baseado nos ZEN?
 
Informação algo genérica, mas cá fica:

Details about Genoa

We can now also close the gap that has so far existed after Milan, because apart from the fact that Genoa will use Zen 4 cores and 5 nm production, very little is known so far and AMD has yet to emerge not commented on further details .

The roadmap now speaks of more than 64 cores for Genoa. It remains with two threads per core, i.e. one SMT2. It remains to be seen whether this will mean a doubling compared to Milan. There is also talk of DDR5, support for Persistent Memory (NVDIMM-P) and PCI-Express 5.0.

With Genoa, AMD is switching from the SP3 to the SP5 platform. The nominal thermal design power ranges from 120 to 240 W, although there are already special models that allow themselves more than 225 W (official TDP limit for normal models). The TDP increases slightly towards the top. AMD gives up platform compatibility with Genoa after three generations. Due to the use of DDR5 and PCI-Express 5.0 as well as other functions, AMD has no other choice at this point.

The EPYC generation after next should have had the first tape out by now. The introduction or presentation is expected in the second half of 2021.

https://translate.google.com/transl...-ueber-acht-kerne-und-ausblick-auf-genoa.html
 
Coloco aqui alguns rumores do Zen4, apesar do texto também falar no Zen3+ e Zen5.
Coloquem sal.

Zen3+
Zen 3+ looks to be a small IPC gain on base Zen 3, having been told “It’s more than Zen+ was [over Zen 1] but not much” which I interpret to mean around a 4 to 7% IPC gain along with customary clock gains moving to the smaller N6 node from TSMC. N6 is a variant of N7 using 5 layers of EUV and is not a true “new node”, more of a refinement. However, the most interesting thing to me is that Zen 3+ on desktop may be the first AM5 CPU. I was told that the IO die for Zen 3+ desktop is using “Not quite [the same] IOD as Zen 4 but uses Zen 4 IP” which I take to mean that it will be using DDR5 and it will be on the same node as Zen 4’s IOD. That’s all I have on Zen 3+, so now on to Zen 4.

Zen4
Zen 4 is what a lot of people are waiting for, and, if the info I have is accurate, that wait will prove to be even more worth it. It is important to note that the one common thread in all Zen 4 chatter I have heard is resounding positivity. From IPC gains over 25%, a total performance gain of 40%, and even possibly (finally) 5GHz all-core thanks to the new (full node) N5 fabrication at TSMC! Now, I can’t say what is true and what is an over-exaggeration, however I was told from a trusted source that a Genoa engineering sample (Zen 4 server chip) was 29% faster than a Milan (Zen 3) chip with the same core config at thesame clocks. Factor this in with what I have heard about the possible clock gains that N5 will enable over N7 and Zen 4 sounds like it is going to be a monster of a CPU.

Zen5
Now I said I had Zen 5 info, unfortunately this comes from a different, less-proven source than my Zen 4 info, however they have said that the jump [to Zen 5 from 4] from will be about as much as Piledriver to Zen 1 design goal, which if you recall to earlier in this article was 40%. I was told from a 3rd source that Zen 5’s original design goal was 2.5 to 3 times the IPC of Zen 1 which roughly lines up with the perspective of a “Piledriver to Zen 1”-like jump.

https://chipsandcheese.com/2021/02/05/amds-past-and-future-cpus/
 
Bom, o que já era grande vai ficar maior... Talvez para criar uma diferenciação para o Threadripper

Fiquei intrigado é manter 8 cores por chiplet, mesmo a 5nm... Ou teremos um die muito pequeno ou os cores vão crescer bastante em complexidade e/ou aumento da L3.

AM5 deve manter com 16 cores de máximo.
 
Fiquei intrigado é manter 8 cores por chiplet, mesmo a 5nm... Ou teremos um die muito pequeno ou os cores vão crescer bastante em complexidade e/ou aumento da L3.

Essa é uma das informações, deste leak, que acho mais estranho. Eu veria um aumento do numero cores por Chiplet até no Zen3+ a 6 nm, se este vier a existir.
No Zen4, se vier a ser a 5 nm, pensei que seria normal esperar 12 Cores por Chiplet, por exemplo.

A manterem 8 Cores por Chiplet, vejo os cores serem mais complexos, mais L3 (Ou L2, como a Intel fez com o Tiger Lake) e............provavelmente, AVX512.
Por falar em AVX512, parece que o Zen4 irá suportar AVX512, segundo estes leaks.

fEBreCu.jpg


Yes it does. Didn't specify it yesterday, but it got out anyway

https://twitter.com/ExecuFix/status/1366297984988831747

Bom, o que já era grande vai ficar maior... Talvez para criar uma diferenciação para o Threadripper

Não me admirava que o Threadripper tivesse +/- o mesmo Package que o Epyc, com 6 Canais de memória no "Normal" e 12 no Pro.

Outra coisa que estranhei no leak, são os 12 Canais de memória, porque em Servidores 2 Sockets (Servidores 2 Sockets são muito populares), significa que ficará "limitado" a 1 DPC. Normalmente, o máximo de DIMMs que se consegue colocar num servidor de 2 Sockets, são 32 DIMMs e por isso é estranho o numero de canais de memória não ser 8 ou 16.
Dito isto, com 6096 pinos, o Package deve ser enorme e por isso, talvez nem fosse realista ter 32 DIMMs num servidor 2 Sockets.

Bom o actual tem cerca de 4094 piños este, a acreditar no que ele diz, vai mandar-se para os 6096 :berlusca:

O leaker colocou um mockup baseado na info que tem:
T6Xnp7t.jpg


Some clarification as there seems to be a bit of confusion: this Genoa mockup is based on the real design (placement of dies, size of dies and package size)

https://twitter.com/ExecuFix/status/1366310317635088385

I have actual pictures of the CPU and diagrams

https://twitter.com/ExecuFix/status/1366359679845216256

Eu sempre gostei de azulejos. :D

AM5 deve manter com 16 cores de máximo.

Provavel, mas a AMD poderá sempre aumentar o numero de canais de memória na plataforma consumidor. Tri Channel, por exemplo?
Se é provável? Acho que não. :)
No entanto, a "distancia", a nível de posicionamento no mercado, entre o Ryzen e o Threadripper, irá aumentar.

Mas há uma teoria ainda mais rebuscada, ou absurda mesmo, que fala em 15 chiplets, sendo que ao acima ainda acrescentava 2 chiplets HBM :coolshad:

Agora eu vou meter a a minha colhereda, se for HBM tem de ser a "nova" PIM da Samsung
https://news.samsung.com/global/sam...igh-bandwidth-memory-with-ai-processing-power

Fui fazer as contas. 12 Canais DDR5-5200 dá 500 GB/s. 2 Chips HBM, pelo menos com as Specs actuais, parece-me um "salto" pequeno para Cache. Talvez com essa HBM ou gerações futuras, faça mais sentido. Ou talvez em SKUs específicos para determinados mercados, como HPC.
Além disso, o uso de HBM iria complicar ainda mais a IO Die. HBM + 12 Lanes DDR5 + 128 Lanes Pci-Ex Gen5 é muita fruta.
Mesmo sem HBM, é quase garantido que a IO Die ter um melhor processo de fabrico em relação à actual IO Die.


Por ultimo, quando vi o leak, uma coisa que me deixou "horrorizado", foram os 320 W de TDP, especialmente quando se faz as contas a Servidores 2 Sockets, em pequenos espaços. Hoje em dia, é muito comum ter 8 CPUs num espaço de 2U, por exemplo e estou a ver muitos destes formatos, não suportarem SKUs com maior TDP.
vcb8yrZ.png


No entanto, fazendo as contas, 320W com 96 Cores, dá 3.33W por Core, o que não é nada mau. :)
 
Última edição:
Aquele mockup nao faz confusão que tem dies ainda mais "longe" do IoD? latencia e tal...

Eu imaginava usarem CCDs de 12 cores e manter na mesma 8 chips.

O IoD deve vir em 7nm. Nos AM5 deve ajudar a diminuir o consumo em idle
 
Eu imaginava usarem CCDs de 12 cores e manter na mesma 8 chips.

Eu até colocava a hipótese da AMD ir ter 2 Chiplets diferentes. Um com 8 e outro com 12 Cores, para ter maior flexibilidade a nível de SKUs.
A parte negativa para a AMD é que isso teria custos mais elevados.

O IoD deve vir em 7nm. Nos AM5 deve ajudar a diminuir o consumo em idle

Também me parece que é isso que irá acontecer. A única duvida é que contrato a AMD tem com a GlobalFoundries e até quando dura, onde estará estipulado que a AMD tem que comprar X numero de Wafers à GlobalFoundries.
Nos AM5, até ajudaria às Boards não precisarem de cooling activo, caso voltasse a ser usado como Chipset.
 
WSA_2019_2021_575px.png

https://www.anandtech.com/show/1391...th-globalfoudries-set-to-buy-wafers-till-2021

O último é este de há cerca de 2 anos.

Agora supostamente temos 2 fontes diferentes a confirmar o aumento do nº de cores.

O HBM-PIM é uma espécie de "Yeti", as primeiras referências da AMD já vêm de 2012/13, isso e o mítico Super APU

- Realizing the Full Potential of Heterogeneity through Processing in Memory
https://www.cs.utah.edu/~rajeev/jayasena15.pdf

- TOP-PIM: Throughput-Oriented Programmable Processing in Memory
https://pdfs.semanticscholar.org/7892/7f5e647ce71f1f2f51a851815b3f36a4c4b6.pdf

(esta apresentação apesar da data de 2014, é a mesma de uma apresentação um ano antes)

- Super APU

AMD’s vision for realizing this overarching goal features a heterogeneous approach, which won’t come as a surprise to followers of the company. AMD talked up the potential benefits of tight CPU-GPU integration for HPC workloads when it acquired graphics chipset manufacturer ATI in 2006, and kicked off the Fusion program. In January 2012, AMD rebranded the Fusion platform as the Heterogeneous Systems Architecture (HSA).

AMD-exascale-vision-figure-1-IEEE-Micro-July-2015.png

https://www.hpcwire.com/2015/07/29/amds-exascale-strategy-hinges-on-heterogeneity/
 

Coloquem algum sal, mas essa Thread no Twitter tem tido mais alguma informação interessante. :)

ldBzhU0.png


https://twitter.com/patrickschur_/status/1366058126928187394

Só para comparação, o package SP3 tem 58,5 mm × 75,4 mm de dimensões, que dá 4410,9 mm² de área. Com aquelas dimensões de 72 mm × 75,4 mm, o SP5 alegadamente terá 5428,8 mm². Um pouco grande este package. :D

d3sd4oi.png


https://twitter.com/ExecuFix/status/1366393857089409030

Para comparação, o Zen2 CCD tem uma área de 74 mm² e o Zen3 CCD tem uma área de 80,7 mm².
O IOD do Epyc "Rome" (Zen2) tem um die size de 416 mm²
 
A complexidade anulou a diminuicao do processo de fabrico. Este zen4, a confirmar 8 cores por chiplet, deve aumentar e muito a complexidade do core junto com aumento de caches provavelmente.

E claro 12 channels, 12 IF links e 160 lanes pcie deve ter feito o transistor count subir 50% ou mais do IoD. Não deixa de ser impressionante que mesmo em 7nm, gasta-se 400mm2 so com IO :n1qshok:

Isso provavelmente deve dar para fazer um CPU de 32 cores monolitico, com boa L3, umas 40 lanes ai e 4 channel (se pensares que o Renoir tem 150mm2, com 8 cores + IGP)...

Como sera no threadripper? tirando os PRO, ja era desperdicio o IoD, com metade das pcie e canais de memoria nao sendo usados (e tambem metade dos links IF em 2 modelos).

Deviam eram fazer o threadripper normal com IoD nativa 4 canais, 4 IF e 64 lanes pcie e deixava este socket gigante para o TR PRO

Por um lado, o IoD do AM5 deve encolher ai para uns 80mm2
 
Última edição:
Isso é daquelas coisas curiosas com CPUs.
Se formos a ver a parte de execução, é uma pequena parte do CPU. Actualmente, ronda 1/3 a 1/4 da totalidade do CPU.
O resto é cache, I/O, OoO, etc..
Gasta-se muito mais transístores a preparar os dados para a execução, do que a executar instruções.
Seria porreiro ver um CPU com um uma largura de execução enorme, mas depois não se conseguia manter o pipeline alimentado com dados para executar e ia dar no mesmo desempenho que um CPU com uma execução mais estreita.
 
Ya, vais ver um CPU single core mais antigo e a parte de I/O era pequena...

O que tem se tornado um problema de temperaturas, porque naturalmente esta area pequena que sai os 10/20w de consumo "por core", caches e I/O consome pouco.

Basta pensar que o IoD dos zen2/zen3 consome 10 a 20w e tem 125mm2. E a versao "chipset" (aka X570) ainda consome menos, bastando um pequeno dissipador com fan ou um dissipador passivo um pouco maior.
 
O CPU die, também tem recebido muita coisa que dantes era externa.
Por exemplo, caches L2 e L3, durante anos, eram chips externos.
O controlador de memória a partir dos A64 e Conroe, passaram a ficar dentro do CPU die.
E depois, foi a vez da northbridge.
A AMD basicamente, voltou a retirar o controlador de memória e northbridge do CPU die, colocando no package.
É um passo para trás, mas que se justifica com o abrandamento da Moore's Law.
 
Sim, o IoD é igual as northbridge do passado, só que integrado no package e não na board.

Conroe ainda era controlador de memoria externo, foi so a partir do Nehalem.

Se integrares o NB dos conroe no package, por "fora" nao vai ficar diferente. Vais ter o cpu com 2 canais de memoria DDR2/3 e 20 lanes pcie para comunicar com o resto do sistema.
 
Ya, o Conroe ainda tinha o controlador de memória externo.
Por acaso, foi impressionante na altura, o Conroe ter uma latência ao nível de um A64.
 
Back
Topo