Processador Nehalem also has a TLB bug

Status
Fechado a novas mensagens.

possessed

Full Throttle BOINC Roller
Confirmed by Intel

We were told that Intel's Nehalem, the CPU that we know as Core i7 has TLB. TLB, three letters that have destroyed the sales of Phenom and Opterons based on 65nm K10 cores, stands for Translation Lookaside Buffer, and Intel officialy states in its Intel Core i7 Processor, Extreme Edition Series and Intel Core i7 Processor - Specification Update PDF, that the CPU has a TLB bug.

If you open Intel’s official document that is nicely stored here, on page 37 AAJ1 Clarification of TRANSLATION LOOKASIDE BUFFERS (TLBS) Invalidation part, you will see that Intel says that in some rare cases improper TLB invalidation may result in unpredictable system behavior and can hang your OS or result with incorrect data. Here is the word to word quote: "In rare instances, improper TLB invalidation may result in unpredictable system behavior, such as system hangs or incorrect data. Developers of operating systems should take this documentation into account when designing TLB invalidation algorithms. For the processors affected, Intel has provided a recommended update to system and BIOS vendors to incorporate into their BIOS to resolve this issue."

We are not sure if you should be concerned, but such a thing completely destroyed K10’s reputation and we will certainly do a bit more investigating about it, and ask Intel for a comment. We would like to thank one of our readers for the tip.


source
 
Eu bem disse que comprar mal sai, não só paga-se preço "premium" como leva produtos "beta".

Cada vez mais os users são "beta testers".
 
Ainda bem que comprei o Q6600 e não quis esperar pelos i7... sendo assim ainda estaria à espera que viesse algo em condições :D Mas também... Eles agora parecem a nokia a chutar telemóveis cá para fora... No espaço de dois anos é só CPU's ao pontapé :o
 
Ainda bem que comprei o Q6600 e não quis esperar pelos i7... sendo assim ainda estaria à espera que viesse algo em condições :D Mas também... Eles agora parecem a nokia a chutar telemóveis cá para fora... No espaço de dois anos é só CPU's ao pontapé :o

É normal, o que eles querem é vender. Pegam num, metem mais L2 e aumentam um bocado o Clock, e está feito, temos aumentos, de 5/6% e também temos serie nova. O pessoal vai todo a correr comprar para testar e não sei mais o quê, eles vão na "onda".

É por isso que uso AMD :)
 
some rare cases
e
In rare instances
e golden eagle,o Nehalem é uma mudança de arquitectura em relação aos anteriores;)
Quanto ao beta-testing suponho que uma boa empresa é a AMD que afirma que tem CPUs superiores,lança-os uns meses atrasados e anda trás o mesmo bug dos Nehalem é que é uma empresa das boas;)
 
e e golden eagle,o Nehalem é uma mudança de arquitectura em relação aos anteriores;)
Quanto ao beta-testing suponho que uma boa empresa é a AMD que afirma que tem CPUs superiores,lança-os uns meses atrasados e anda trás o mesmo bug dos Nehalem é que é uma empresa das boas;)

Sim, eu não me estava a referir aos Nahalem (Core i7) estava a referir-me aos Core 2.

Quando fiz referencia à AMD foi não no sentido da qualidade /performance mas sim, da frequência de lançamentos.
 
e e golden eagle,o Nehalem é uma mudança de arquitectura em relação aos anteriores;)
Quanto ao beta-testing suponho que uma boa empresa é a AMD que afirma que tem CPUs superiores,lança-os uns meses atrasados e anda trás o mesmo bug dos Nehalem é que é uma empresa das boas;)

Seria de supor k uma empresa como a Intel tivesse o cuidado de evitar os erros da concorrência, tanto mais k foi um erro muito badalado e k teve consequências nefastas para a AMD.

Mas não tenho dúvidas k esse erro será rapidamente resolvido por parte da Intel, tendo em conta a capacidade (financeira e tecnológica) da empresa.

Já agora, tb estou curioso em saber kal a implicação desse erro em aplicações reais e na performance do processador.
 
e e golden eagle,o Nehalem é uma mudança de arquitectura em relação aos anteriores;)
Quanto ao beta-testing suponho que uma boa empresa é a AMD que afirma que tem CPUs superiores,lança-os uns meses atrasados e anda trás o mesmo bug dos Nehalem é que é uma empresa das boas;)

o que vejo é a intel cometer o mesmo erro que a amd fez há um ano, que com tanto dinheiro que têm não consigo entender com o conseguiram fazer a saberem o que aconteceu aos amd, e depois tens de sair debaixo da pedra para saber que há seis meses que o problema nos amds está resolvido

os problemas do tlb também era em casos raros e muito específicos, duvido que alguem com um agena b2 em casa tenha alguma vez "tropeçado" no bug e caso tenha acontecido estamos a falar em <1% dos possuidores dos mesmos
 
Última edição:
Hmmm, é impressão minha ou este problema é um bocado redundante no i7 e, tal como o próprio artigo indica, de baixa probabilidade de ocorrência (ao contrário dos Phenom, em que o problema seria relativamente provável de ocorrer fora do ambiente doméstico)? É que, segundo sei, a cache L3 (tal como a L2) dos i7 é inclusiva, o que significa que, a cada passo, TODO o conteúdo de TODAS as caches de baixo nível está presente a todos os núcleos do CPU.

O que significa que, e pelo pouco que percebo do TLB e de arquitectura de CPUs no geral, um erro de TLB nos i7 só pode ocorrer quando, e uma vez que a L3 é a única partilhada, um dos núcleos tenha acabado de fazer alterações a um valor presente na sua L2, outro núcleo queira esse valor e o vá buscar à L3, onde ainda não foi actualizado, dando como resultado um "soluço" que pode ser qualquer coisa desde um valor errado até um "engasganço" completo do sistema. Se estou a ver a situação pelo prisma correcto, parece-me algo "não crítico", e possivelmente alguma coisa que não deva acontecer muitas vezes, mesmo tendo em conta o crescente paralelismo do software e de os próprios SOs terem tendência a fazer as threads "pular" de CPU para CPU.

Entretanto, e também por causa da estrutura da cache nos i7 (e, novamente, se estou a ver a coisa como deve ser), a solução parece também ser relativamente simples (comparando com a do Phenom), e sem grandes perdas de performance (provavelmente um ligeiro aumento da latência nos acessos a zonas da L3 que dizem respeito à L2 de outros núcleos, para permitir que qualquer operação de actualização seja concluída - ou iniciada). Digo eu, claro...

Btw, para os que acham que andamos a ser "beta testers", convém ter em conta o seguinte:

1) Um CPU novo demora ANOS a planear, e passa por inúmeras fases de testes e alterações, mesmo depois de já se ter a arquitectura toda "direitinha". Há muita coisa que corre mal pelo meio, as revisões de silicone pré-mercado (sem contar com as revisões em modelo digital) chegam a ser às dezenas (felizmente esses são casos raros, geralmente ao fim de meia dúzia já se sabe se é preciso despedir uma equipa de engenheiros ou não... :-D);

2) Quando se implementa uma arquitectura de CPU fazem-se compromissos. E com esses compromissos sabe-se que podem surgir alguns problemas na aplicação real, pelo menos enquanto ninguém tiver uma epifania e disser "E se fizermos assim?", altura em que se muda ligeiramente a arquitectura, e sai uma nova revisão do silicone, ou um CPU completamente diferente. Na prática, o que interessa reter é que os "errata" em CPU são às dúzias em cada geração. Geralmente são conhecidos e compensados, quer pelo software quer por actualizações de microcódigo, quer por revisões de hardware, e não significa que estejamos a ser "beta testers", são apenas o resultado natural das escolhas feitas para a arquitectura (com as suas excepções, obviamente). Raros são os "errata" que causam transtornos graves e recorrentes (como o célebre bug nos Pentium originais), geralmente são pequenos "ups!" aqui e ali, com probabilidades baixas de ocorrer (mesmo o bug de TLB dos Phenom não era nada de crítico, a probabilidade de ocorrer, mesmo em ambientes de virtualização, não era assim tão alta). Não nos deixemos alarmar.

Cumps.

Miguel
 
o que vejo é a intel cometer o mesmo erro que a amd fez há um ano, que com tanto dinheiro que têm não consigo entender com o conseguiram fazer a saberem o que aconteceu aos amd, e depois tens de sair debaixo da pedra para saber que há seis meses que o problema nos amds está resolvido

os problemas do tlb também era em casos raros e muito específicos, duvido que alguem com um agena b2 em casa tenha alguma vez "tropeçado" no bug e caso tenha acontecido estamos a falar em <1% dos possuidores dos mesmos

Estás errado, porque associas o facto de o bug ser numa secção semelhante do chip a tudo o resto que de mal aconteceu à AMD nessa altura, e nada podia ser mais diferente.

Em primeiro lugar, o "Barcelona", quando finalmente foi lançado (e isto já é ser generoso, porque quase não existia em quantidade real no mercado retail), vinha tentar a "salvação" da AMD da sua posição de distante segundo lugar em performance real (por Watt e por dólar), e falhou redondamente.
Neste caso, o Core i7 vem substituir o Core 2 da própria Intel no topo absoluto da performance, e até tem uma performance por watt bem melhor do que a do Core 2 (só não é melhor performance por dólar porque toda a plataforma que o rodeia ainda está claramente "verde" -DDR3, só há um chipset compatível, X58, de topo e caro, a infraestrutura do socket físico é nova, etc).

Em segundo, porque o bug TLB do "Barcelona" original não só foi tardia e oficialmente reconhecido pela empresa, como esta continuou a tentar escoar o stock enquanto apressava a revisão B3, que resolvia o problema, e adiou por demasiado tempo uma BIOS para resolver o problema interinamente.
Como consequência, quem comprou o Phenom/Opteron da primeira geração ficou sem saber se o bug seria resolvido alguma vez, e sem saber ser esta solução acatava mais uma diminuição da já fraca performance face aos Core 2 Quad/Xeon.
Com o Core i7, a Intel lançou o código de BIOS que corrige/contorna o problema de imediato, quase em simultâneo com a sua divulgação, pelo que só com testes independentes é que se pode avaliar o impacto na performance (se é que há algum, pois eu duvido que a cache inclusiva típica das CPU's Intel dê origem a tantos problemas em cascata com bugs dos buffers de pre-fetching, como a cache exclusiva das CPU's AMD desde o Athlon original de 1998).

Terceiro, a Intel não prometeu que os chipsets actuais seriam compatíveis com o Core i7, ao contrário da AMD na altura (e verificou-se que muitas motherboards AM2 -diferente de AM2+, note-se- revelaram-se incompatíveis na prática, sobretudo por causa dos enormes TDP's das novas CPU's de 65nm, requisitando VRM's mais robustos capazes de suportar a sua alimentação).
O socket 1207 foi outra história, mas a sua implantação real no desktop resumia-se aquela caríssima e rara motherboard inicial da Asus com dois Socket F (chipset Nvidia), populados por duas CPU's Athlon 64 X2.
 
Última edição:
Mal li o titulo deste topico vi logo que mais uma vez viria a disputa: AMD VS Intel.

Este pequeno erro da Intel não terá tanto impacto na utilização dos seus user's quanto terá na sua reputação.

Não deveria haver comentários parciais, como se notou de parte a parte, embora muito mais acentuado da parte de user's com sistemas com cpu's da AMD.

É um erro da Intel, já cometido pela AMD também, que poderá em casos muito raros afectar o funcionamento do PC e que muito brevemente será resolvido pela Intel. Nada de grave porque não terá um impacto significativo nos seus user's, ao contrario do que terá sobre a Intel.

Este erro da Intel não deve ser usado como argumento de user's da AMD para justificar a sua preferência porque é recente demais pra ter afectado a compra dos possuidores da AMD, para além de todos termos de admitir que a Intel nos ultimos anos tem tido as melhores soluções de CPU's.

Antes de me verificarem se fui parcial no meu "mysystem": tenho um AMD ;)
 
Última edição:
Certamente a Intel nao irá ser afectada nas vendas como a AMD foi, é do conhecimento de todos que basta ter lá Intel escrito, para vender sem grandes problemas, coisa que nao acontece com um AMD.
 
Status
Fechado a novas mensagens.
Back
Topo