Intel Meteor Lake [2023]

O problema da instabilidade dos raptor lake, pelo que vi, na grande maioria dos casos não se deve a ram. É mesmo degradação do silício dos núcleos, em alguns casos também podes ter degradação do IMC mas não é tão comum.

É o que dá lançarem cpus em stock do lado errado da curva de v/f, a juntar a isso tens boards high-end que nem os limites da Intel respeitam. Alguns destes cpus estão a experienciar electromigração acelerada e por vezes é gente que só os colocou a funcionar em stock. Curiosamente é sempre em boards Z e processadores K, com PL1=PL2 ilimitado e MCE ativado por default. Que é basicamente o equivalente a comprares um ryzen já com OC de fabrica e como se não bastasse o fabricante da board ainda te ativa o PBO automaticamente.

Degradação acho mais raro, mas também é possível. Os cores do meu 13700kf estão exatamente iguais a quando recebi o chip, mas nunca esteve a 90º+C e 250+w durante muito tempo.

Eu já trabalhei com 13700k / 13900ks e o meu 13700kf. E stock todas boards da asus fazem undervolt (AC_LL mais baixo), em todos eles reduzir o AC_LL ainda mais manualmente permite cerca de 20-30mv undervolt antes de ficar instável (whea errors/crashes) em loads pesados como y-cruncher small fft/prime95 smallfft/ stockfish chess engine.

Não deve ser difícil que apareçam chips com vf curve mais apertada que fiquem instáveis com o UV stock que as boards aplicam.

 
Última edição:

A culpa é de ambos. Mas o utilizador final também tem culpa.
As boards não deviam remover power limits stock. Mas se um chip crasha stock com power limits (pl1/pl2 253w / ICCmax 307A) é problema da intel.

Intel fail safe/baseline obviamente que torna qualquer chip estável, mas se um chip precisa dessa voltagem toda é RMA e nem devia ter saído da fábrica.

As boards fazem UV de origem (SVID trained/auto). Dos 4 chips da Intel que testei todos têm +- a mesma margem de 20-30mv com boards Asus diferentes. Ou seja a asus já otimiza loads lines para o chip ficar no limite mas garantir estabilidade em todos os loads até 100ºC.
Isto é bom e mau. Pode sempre haver um chip ou outro que não aguente e também não é muito dificil degradar um chip 20-30mv com power limits desbloqueados...
 
Última edição:
Sinceramente, o que me surpreende é estes cpus andarem perto dos 300W há já algum tempo e só agora se começou a verificar que estão a dar problemas.
 
Degradação acho mais raro, mas também é possível. Os cores do meu 13700kf estão exatamente iguais a quando recebi o chip, mas nunca esteve a 90º+C e 250+w durante muito tempo.

Eu já trabalhei com 13700k / 13900ks e o meu 13700kf. E stock todas boards da asus fazem undervolt (AC_LL mais baixo), em todos eles reduzir o AC_LL ainda mais manualmente permite cerca de 20-30mv undervolt antes de ficar instável (whea errors/crashes) em loads pesados como y-cruncher small fft/prime95 smallfft/ stockfish chess engine.

Não deve ser difícil que apareçam chips com vf curve mais apertada que fiquem instáveis com o UV stock que as boards aplicam.


Não é fácil teres degradação ao fim só de uns meses, a não ser que a corrente seja muito elevada, mas é possivel principalmente nestas litografias mais pequenas. Degradação por temperatura, era necessário teres hotspots no chip acima de 120ºC, é claro que isto depende da resiliência da litografia a esse efeito e isso são dados internos que apenas a Intel tem acesso.

Olhando mais atentamente para este caso, parece-me ser mais um problema de controlo de qualidade da Intel. Estes chips deveriam ter mais margem para aceitarem os settings default de todas as boards, ou isso ou a spec que a Intel fornece aos fabricantes teria de ser mais apertada.

Não é por acaso que a maioria dos chips que têm tido problemas são i9s.

E tenho visto que algumas das correções que têm saido para as BIOS, com o chamado "Intel default" são ainda pior e variam imenso dependendo do fabricante da motherboard.
 
Não é fácil teres degradação ao fim só de uns meses, a não ser que a corrente seja muito elevada, mas é possivel principalmente nestas litografias mais pequenas. Degradação por temperatura, era necessário teres hotspots no chip acima de 120ºC, é claro que isto depende da resiliência da litografia a esse efeito e isso são dados internos que apenas a Intel tem acesso.

Olhando mais atentamente para este caso, parece-me ser mais um problema de controlo de qualidade da Intel. Estes chips deveriam ter mais margem para aceitarem os settings default de todas as boards, ou isso ou a spec que a Intel fornece aos fabricantes teria de ser mais apertada.

Não é por acaso que a maioria dos chips que têm tido problemas são i9s.

E tenho visto que algumas das correções que têm saido para as BIOS, com o chamado "Intel default" são ainda pior e variam imenso dependendo do fabricante da motherboard.

Se as boards operam os chips abaixo do VID em load com IA CEP disabled o problema não é da Intel...
Se não desligassem IA CEP não havia problema porque o chip faz "clock stretching" quando leva com undervolt para garantir estabilidade.

A verdade é que todos gostam de ter bons resultados nos benchmarks. Logo undervolt e IA CEP off em todas as z690/z790 stock. Dos 4 chips que testei todos estavam estáveis stock, mas como disse anteriormente, todos no limite em loads avx2 pesados. prime95 avx2 smallfft / stockfish chess engine são os loads que piores para estes chips. O stockfish é realista, porque não é um power virus.

O meu 13700k consegue -60mv em relação ao stock undervolt da asus com LLC tudo em auto. Mas no stockfish só consegue -25mv, mas também tem muito mais vdroop por ser um load com muito mais currente.
O prime95 avx2 smallfft é ainda mais pesado com mais vdroop mas é semelhante ao stockfish em termos de voltagem.
 
Última edição:
Se o problema fosse só respeitar a tabela de VID não tinhas chips que só passados uns meses começam a dar bluescreen. Tens demasiados limões vendidos como i9. Não é por acaso que a maioria dos problemas reportados são i9s.

Aliás a tabela do VID seria respeitada se a Intel fosse rigorosa em implementar limites claros naquilo que os fabricantes de motherboards podem colocar no power limit em default, as próprias recomendações para AC_LL são demasiado relaxadas e não ajuda que sejam apenas recomendações que basicamente podem ser ignoradas.
 
Última edição:
hein? o buildzoid tem um 14900k ou ks (não me lembro ao certo) que em configurações stock após reset da bios crasha no cinebench. Em que medida é que o utilizador final tem culpa?

Nesse caso em especifico não. Mas também acho muito estranho um chip crashar assim tão rápido no r15 stock, é que nem é nada muito pesado, é mais pesado que r23 mas não se compara a prime95 small fma3 por exemplo.

O chip é novo ou degradou? Não vi o video btw.
 
Última edição:
Nesse caso em especifico não. Mas também acho muito estranho um chip crashar assim tão rápido no r15 stock, é que nem é nada muito pesado, é mais pesado que r23 mas não se compara a prime95 small fma3 por exemplo.

O chip é novo ou degradou? Não vi o video btw.
Review sample out of the box.

E não é caso único, muita gente se queixa de instabilidade com settings stock e a instabilidade tem-se vindo a agravar.
 
Se o que o Steve disse for verdade, então confirma-se mesmo a electromigração acelerada. Não é degradação por tensão a mais que dá cabo do gate do transistor, é mesmo electromigração devido a corrente a mais. O que é o que eu já esperava, mas não deixo de ficar estupefacto como é que a Intel deixa passar isto e não faz qualquer tipo de validação de motherboards.

Cada AIB tem de adivinhar o que a Intel quer no loadline dado os intervalos ridiculos da spec sheet, basta um pouco de impedância a menos que já é o suficiente para passarem correntes elétricas ridiculas pelo chip em cargas de trabalho como aquelas que assistimos em boards com PL1 e PL2 ilimitado que na prática são mais de 300w.

A boa noticia é que pelos vistos Arrow Lake vai trazer uma melhoria na eficiência e pelo menos se a Intel continuar com esta politica de não validar nada, pelo menos não devem existir estes problemas visto que o consumo dos cpus vai ser menor.
 

Intel releases eTVB microcode fix and new Default Settings for 13/14th Gen Core i5/i7 CPUs, instability investigation still ongoing​


However, in investigating this instability issue Intel did discover a bug in the Enhanced Thermal Velocity Boost (eTVB) algorithm which can impact operating conditions for Intel Core 13th and 14th Gen (K/KF/KS) desktop processors.

We have developed a patch for the eTVB bug and are working with our OEM/ODM motherboard partners to roll out the patch as part of BIOS updates ahead of July 19th, 2024.

While this eTVB bug is potentially contributing to instability, it is not the root cause of the instability issue.

https://videocardz.com/newz/intel-r...-cpus-instability-investigation-still-ongoing
 
A intel não acerta uma de há uns anos para cá, começa a ser preocupante para a saudável concorrência e não só em x86.
 
Última edição:

Intel releases eTVB microcode fix and new Default Settings for 13/14th Gen Core i5/i7 CPUs, instability investigation still ongoing​


However, in investigating this instability issue Intel did discover a bug in the Enhanced Thermal Velocity Boost (eTVB) algorithm which can impact operating conditions for Intel Core 13th and 14th Gen (K/KF/KS) desktop processors.

We have developed a patch for the eTVB bug and are working with our OEM/ODM motherboard partners to roll out the patch as part of BIOS updates ahead of July 19th, 2024.

While this eTVB bug is potentially contributing to instability, it is not the root cause of the instability issue.

https://videocardz.com/newz/intel-r...-cpus-instability-investigation-still-ongoing
Se for pelo bug e resolver ok mas caso não é algo grave ter 13900/14900 instavel em certos cenarios e unreal engine 5 principalmente . Demorou foi a investigar .

cumps
 
Se for pelo bug e resolver ok mas caso não é algo grave ter 13900/14900 instavel em certos cenarios e unreal engine 5 principalmente . Demorou foi a investigar .

cumps

A maioria da malta que tem crashes em jogos, principalmente UE5 é ram/imc e não core. O TVB pode ser problemático com o single/dual core boost que pode ser acionado momentaneamente. Para que esse boost funcione os outros cores têm de entrar em sleep, c states tem de estar on.
Normalmente em jogo os p cores não entram em sleep(c-states) e só é usado o all core boost, mas mesmo assim esse boost pode ser acionado ocasionalmente em situações que durem meros milissegundos e pode causar problema de instabilidade.
 
Última edição:
Back
Topo