Processador Apple Custom Processors (Kalamata)

Como não há muitos resultados deste Ultra, fica aqui os primeiros resultados no Passmark:

ZnuTOYf.png

Em Single Thread, fica por volta do i7-12700 da Intel.

5F3koFF.png

Em Multithread, fica ali por volta do Threadripper Pro 5945WX, que é um Threadripper só com 12 Cores. Por exemplo, o Ryzen 5950X, com 16 Cores, fica um pouco acima.

https://www.cpubenchmark.net/cpu.php?cpu=Apple+M1+Ultra+20+Core&id=4782

Os testes do Passmark:
Código:
CPU Test Suite
[*]Integer Maths Test
[*]Floating Point Maths Test
[*]Finding Prime Number Tests
[*]Sorting Test
[*]Encryption Test
[*]Compression Test
[*]Physics Simulation Test
[*]Extended Instructions Test (SSE, AVX, AVX512, FMA, NEON) (Depending whether x86 or ARM)
[*]CPU Mark: an aggregate mark to easily compare overall CPU perfromance between systems.
A versão Mac a correr nos M1 é nativa.

Era preferível ter bastantes scores de aplicações reais, que existissem em MacOS/Windows/Linux e acho este score em Multithread demasiado baixo, mas é o que há. :)
 
Novamente uma funcionalidade especulativa, que tem resultado a melhoria de performance, resulta também num problema de segurança.
Ninguém vai querer retirar este tipo de funcionalidades nos processadores modernos, porque a queda a nível de performance seria enorme. Ao mesmo tempo, os fabricantes têm que ter muito mais cuidado, com todo o tipo de problemas que estas funcionalidades levantam.
 
Ontem foi anunciado o Apple M2. Parece-me ser um "Tock" do M1. O próprio processo de fabrico usado é uma evolução dos 5 nm TSMC.
7EAgpK3.jpg


As melhorias de performance também parece reflectir isso.
QsXULUv.jpg


Apenas uns comentários. Caches L1 enormes. Gostava de perceber como é que a Apple consegue ter caches L1 tão grandes, sem que tenha grandes problemas com as suas latências e porque é que os rivais não conseguem.
dKI2W90.jpg


Neste segmento, não percebo porque melhoraram o encode/decode de ProRes e não parece que suportam, pelo menos, decode de AV1. Para este segmento e para futuro, acho que é mais importante.
PDnGug7.jpg


Neste M2 "simples", o que mais me impressiona é eles continuarem a ter o Macbook Air totalmente passivo. Neste aspecto, em combinação com a performance, acho que não há nada no mercado que lhe faça concorrência.
 
18% de performance no mesmo processo de fabrico e sem subir consumo só consigo me lembrar da passagem do zen2 pro zen3.

Não sei se perderam oportunidade de por mais uns 4 e-cores
 
18% de performance no mesmo processo de fabrico e sem subir consumo só consigo me lembrar da passagem do zen2 pro zen3.

Não é bem o mesmo processo de fabrico, mas sim uma evolução dos 5nm. Mas também não acredito que essa evolução desse 18% de performance para os mesmos Watts, por isso deve haver ali muita optimização por parte da Apple.
 
Sim, mas o zen3 também não deve usar o mesmo 7nm do zen2, certo? Não deixa de ser um excelente resultado sem mudança de node, apenas com optimização deste + melhoria de arquitectura.

Resta saber se parte dos 18% inclui clockspeed maior (penso que o máximo era 3.2 ghz no M1).

Outra coisa que acho intrigante é não possuir SMT
 
Sim, mas o zen3 também não deve usar o mesmo 7nm do zen2, certo? Não deixa de ser um excelente resultado sem mudança de node, apenas com optimização deste + melhoria de arquitectura.
Aparentemente, tanto o Zen2 como o Zen3, usam os mesmos 7+ nm da TSMC. De referir que 7+ não é compatível com 7.
Zen 3 is fabricated on TSMC's 7nm+ process for the Core Compute Die (CCD), the same process used in Zen 2 Refresh processors
https://en.wikichip.org/wiki/amd/microarchitectures/zen_3#Process_technology
The N7+ node is TSMC's first process technology to adopt EUV lithography. It is unrelated to both the N7 and N7P processes, and is not IP-compatible with either, requiring re-implementation (new physical layout and validation). N7+ entered mass production in the second quarter of 2019 and uses EUV for four critical layers. Compared to TSMC N7 process, N7+ is said to deliver around 1.2x density improvement. N7+ is also said to deliver 10% higher performance at iso-power or, alternatively, up to 15% lower power at iso-performance. On paper, N7+ appears to be marginally better than N7P, albeit that comes at the cost of re-implementing the design.
https://en.wikichip.org/wiki/7_nm_lithography_process#N7.2B

Pelas datas, também faz sentido, visto que o mass production de 7+ foi iniciado em 2Q 2019 e o Zen2 foi apresentado em Julho de 2019.

Em relação à Apple e a este M2, quando eles dizem "2 gen 5 nm", poderá querer dizer várias coisas. Pode ser N5P, N4, N4P.
Por exemplo, comparação de TSMC N5P com N5:
Speed @ iso-powerPower @ iso-speed
~7%~15
https://en.wikichip.org/wiki/5_nm_lithography_process#N5P
 
Aumento bastante significativo a nível de área.
The overall performance gains are quite disappointing when you factor in the raw cost increase that comes with this new M2 and the fact that it has been nearly 2 years since the M1’s introduction.
Tendo em conta que usa um tweak do mesmo processo de fabrico, não sei se não estão a ser demasiado negativos.
We discussed this in the past, but a lot of the slow down stems from Apple losing leagues of amazing engineers to firms such as Nuvia and Rivos. The bleeding hasn’t stopped in recent years as Apple’s work culture simply isn’t the best and other firms, namely the hyperscalers such as Google, Microsoft, Amazon, and Meta, are paying more than Apple was to poach talent. Lastly, there has also been an exodus of non-money motivated engineers who think they were successful in transitioning Apple off of Intel silicon, and onto the in-house silicon. These engineers have also left to work on what they believe are more interesting projects elsewhere in the industry whether it is the hyperscalers or traditional firms.

These departures have culminated in A15 and M2 as well as potentially the upcoming A16 to deliver more tepid CPU gain
Interessante.
We have heard that the A16 will not utilize the next generation Armv9 based core which is quite sad if true given Apple was the first to implement Armv8. We have heard this next generation Armv9 core will only come in M3 which will be Apple’s first product on the TSMC’s N3 node.
De facto, pelos relatos da altura, a competição (especialmente a Qualcomm), foi completamente apanhada de surpresa, quando a Apple conseguiu apresentar um ARMv8, muito antes do que se pensável possível.
Vamos ver se fica para trás a nível de ISA em ARMv9.

No resto do artigo, parece que os E Cores e o GPU, são iguais a nível de arquitectura em relação ao A15 e os P Cores têm apenas alguns tweaks. GPU com mais Cores, Clocks mais altos, mais Cache e LPDDR5.
 
Um post que acho interessante sobre o M4 num Mac Mini.
I expected M4 to be better than M1/M2 (I haven't personally tested M3), and I hoped it would at least match the previous total-system-power efficiency king, a tiny arm SBC with an RK3588 SoC... but I didn't expect it to jump forward 32%. Efficiency gains on the Arm systems I test typically look like 2-5% year over year.

The M4 mini I just bought reaches 6.74 Gflops/W on the HPL benchmark.

I can get 283 Gflops at 42W, versus 264 at 66W on my M1 Max Mac Studio (for a round 4.00 Gflops/W).

The chip isn't the fastest at everything, but it's certainly the most efficient CPU I've ever tested. And that scales down to idle power, too—it hovers between 3-4W at idle—which is about the same as a Raspberry Pi.

This is total system power draw, too—not just the CPU.

And the system I bought includes 10 Gigabit Ethernet and 32 GB of RAM; most systems I've used consume 4-6W just running the 10 GbE controller!
https://www.jeffgeerling.com/blog/2024/m4-mac-minis-efficiency-incredible
 
4W em idle é ridículo mesmo, mas esta leitura é por software ou algum equipamento lendo o consumo na tomada?
Dado que sendo system tem que contar com SoC com a RAM, mais SSD, controladores, a perda pela fonte AC-DC...

Mas não fico admirado. O M3 pro MBP que uso tem consumo sub 10w em idle de "system power".

A ultima frases é interessante, porque mesmo o 10 gigabit lan que usam é extremamente eficiente! qual será que usa?

É o que digo, a Apple poderia detonar o mercado se fosse mais competitiva nos preços dos upgrades. Era só o base vir com 512GB e cortar para metade o preço dos upgrades e ia vender pouco ia...

qq dia compro um só para brincar e ensinar minha mãe usar isso ahaha
 
Última edição:
4W em idle é ridículo mesmo, mas esta leitura é por software ou algum equipamento lendo o consumo na tomada?
Dado que sendo system tem que contar com SoC com a RAM, mais SSD, controladores, a perda pela fonte AC-DC...
Na tomada. :)
  • Idle power draw (at wall): 4.1 W
Aquele número, além da Lan 10 Gbit, é com 32 GB de RAM e 1 TB SSD. Também é com o "Low Power Mode" desligado.
vJ0KS9J.png


Ele tem mais números no github:
0zHWAWV.png


Eh2P7qB.png


LXmP8rA.png


https://github.com/geerlingguy/sbc-reviews/issues/57

Ele também tem um pequeno video:
A ultima frases é interessante, porque mesmo o 10 gigabit lan que usam é extremamente eficiente! qual será que usa?
Boa pergunta. Não encontro, mas com aqueles valores, não estará integrado no SOC?
Mas não fico admirado. O M3 pro MBP que uso tem consumo sub 10w em idle de "system power".
E nesse caso tens o consumo do ecrã.
 
Eu ainda ando satisfeito com o meu M1 “coxo” do MacBook Air. Foi das melhores compras que fiz.

Só posso imaginar o nível de satisfação de quem tem apostado nas gerações seguintes. E agora está última continua a dar cartas. É impressionante e estou curioso para perceber como é que se atingem esses números de consumo energético.
 
Nem tem nem comparação com o Intel 2019, que tinha consumo em idle de uns 10-15w, com monitor externo ia para 20-25+ e em load facilmente chegava à puxar mais de 100w, à ponto que neste ponto, já buscava energia à bateria, dado que o carregador só dá 96w.

Já o M3 pro acho que não o vi passar dos 30w, o único momento que puxa 90w+ é quando carrega a bateria :002:
 
Alegadamente a Apple experimentou um "M4 Extreme" com CPU 64 Cores / GPU 160 Cores, o quádruplo do M4 Max, mas decidiu não avançar.

Apple this "past summer" canceled the development of a high-performance Mac chip that would have consisted of four smaller chips stitched together, in order to free up engineering resources for a planned AI server chip, according to The Information.

Based on the report's description of the chip, it sounds like Apple has canceled a previously-rumored "Extreme" chip for the Mac. It was previously reported that an "M2 Extreme" chip was scrapped a few years ago, but perhaps Apple had revisited the idea since then. In any case, it now sounds like an "M4 Extreme" chip is also unlikely.

Apple likely would have introduced the "M4 Extreme" in its high-end Mac Pro tower. The chip would have offered even faster performance than the M4 Ultra chip that is expected to launch in new Mac Studio and Mac Pro models later next year.

If the "M4 Extreme" were to have been a quadrupled version of the M4 Max chip that debuted in the MacBook Pro a few months ago, it would have had massive specifications, including up to a 64-core CPU and up to a 160-core GPU.

While the "Extreme" chip may be off the table once again, it seems like Apple has repeatedly shown interest in developing such a chip, so perhaps it will eventually materialize as part of the M5 series or later. For now, though, the wait continues.
https://www.macrumors.com/2024/12/11/m4-extreme-chip-unlikely/

Seria interessante ver um processador da Apple com estas especificações.

Estarão também a desenvolver um Chip no mercado Servidor para AI, com a Broadcom e para uso interno.
The Information today reported that Apple is developing a new server chip that will offer even faster performance for AI features.

At least a trio of companies are believed to be involved with the chip. Apple is said to be handling the overall design of the chip, while Broadcom is said to be providing some networking technology for it. TSMC is expected to begin mass production of the chip in 2026, using its third-generation 3nm process, known as N3P.
Apple will likely use the new AI chip in developing for inference, where the chip processes new data—such as a user describing a possible image—and applies them to the models to generate an output, like producing the image itself.
Like Google, Apple is relying on Broadcom for technology to network or link the chips together so they can work in unison to compute data more quickly. That technology has been one of the key drivers of AI development, making it possible to compute the massive amounts of data required to train and run LLMs. Networking technology is one of Broadcom's key strengths.
https://www.macrumors.com/2024/12/11/apple-intelligence-servers-new-chip-report/
 
Back
Topo