Cell bate concorrência em benchmark de computação de alto desempenho

Para general purpose bem que pode ser, o resto é workaround.

Mesmo que fosse workaround, qual seria o problema?

A tua tese inicial era que o Cell era desadequado para jogos. Continuas a não conseguir apresentar qualquer facto que a consiga apoiar. Lamento, mas simplesmente atirar opiniões para o ar é manifestamente insuficiente.

E daqui a bocado é um core 2 Duo não? :p
Não sei, diz-me tu?

Quem é que começou a dizer disparates como "leva uma coça" de um P4", só para depois mudar de discurso para "estão mais ou menos ao mesmo nível"?

Se não compreendes a diferença entre "levar uma coça" e "estar ao mesmo nível", então lamento, mas este diálogo torna-se demasiado imbecil, e podes continuá-lo sozinho.

A performance é o que é (e eu nunca falei em pentium 3's) De resto nem sei porque é que estamos ainda a falar do raio do P4, bastava-lhe ter 533 MHz de FSB e já limpava o coitadinho do cell nas horas naquelas tasks (é realisticamente o mais perto do cell)Boa, mas isso não me resolve ter de lidar com as lacunas do Cell se a minha opção é usar a grafica.
Ninguém te obriga a lidar com as lacunas do Cell. Afinal de contas é uma plataforma da qual pareces saber muito pouco.

ah, então um GPU é ideal para programação general purpose! De facto a AMD agora que comprou a ATi devia concorrer com o Core 2 Duo com ATi Radeons, não com Phenoms.
Nunca disse que era ideal. Foste tu quem levantou essa falsa (e irrelevante questão). O que interessa no final de contas é o desempenho na resolução dos problemas específicos com que se depara o programador.

Oh pá... claro que não, uma coisa é proof of concept outra coisa é realmente ser viável e eficaz de ser utilizado.Também já disse o que tinha a dizer, mas acrescento que de facto as SPE's teriam pouco impacto, teriam muito impacto em whetstones, pouco impacto em dhrystones; são fortes em floating point performance, são fraquissimas em general purpose.
Tenho a sensação de que não sabes do que estás a falar. Afinal o que é que consideras general purpose, é o processamento de inteiros, são as instruções condicionais? Ambas?

Já te expliquei que um FPU consegue processar inteiros. Se não consegues compreender algo tão simples não te posso ajudar.

Mas porque quereriam trabalhar nessa "arquitectura especializada"?, é essa a questão; especialmente para jogos.
Porque é rápida?

Certo, optimização. Mas isso atenua o impacto para quem trabalha nela, não anula os handycaps.Lá está, será que compensa? eu acho que não, não nos dias que correm em que há outras formas de ter potencia.
Quais handycaps? Só é handycap para quem tem medo de aprender coisas novas.

Arquitectura proprietária seria boa para a Sony se a PS2 se repetisse; assim acabou por ser um tiro no pé.Tudo o que disse sobre o Cell o fundamenta, aliado de todas as third party's que se queixaram.De facto, não interessa amandar bocas dessas.
Nada do que disseste sobre o Cell foi fundamentado, muito pelo contrário. Toda a gente viu as contradições em que te embrulhaste.

Uns foram estupidos por terem problemas de dissipação de calor, sem duvida, mas se queres que te diga... o software está lá, e a facilidade dos resultados também...
Que bom! O software funciona, mas o hardware...não.

É esta a tua ideia de uma plataforma digna de investimento? Que ridículo.

Interessante que a seguir a "4 integer units" a unica coisa que dizem é "capaz de 32 gigaflops" e eu à espera de indicadores de performance integer. As SPE's para General purpose são menos que ideais, cache diminuta, ausencia de branch prediction e não executam instruções multiplas por clock entre muitas outras coisas.
Ah, agora já passaram de "fraquissimas" a "menos que ideais".:-D

Daqui a mais umas páginas se calhar já estás a dizer que são "razoáveisitas"... :lol:

Elas não têm cache, têm uma memória rápida local, e são capazes de branch prediction sim senhor, embora seja com auxílio do compilador.

Usáveis? claro, como tu dizes até os GPU's o são. Ideais? longe disso.
Mais uma vez a mesma questão irrelevante.

O Cell não é de forma alguma uma máquina perfeita. Mas é de longe melhor que a concorrência em tarefas de elevada carga de processamento, como foi demonstrado no teste da página inicial.

Em relação aos jogos acho que está tudo dito, não vejo razão para se continuar off-topic.
 
Última edição:
Elas não têm cache, têm uma memória rápida local, e são capazes de branch prediction sim senhor, embora seja com auxílio do compilador.

Tu tens noção da barbaridade que acabaste de dizer? Branch prediction pelo compilador? É que nem vale a pena comentar...

:lol:


...mas aqui fica uma pequena explicação:

Workarounds com compiladores não são branch prediction. Com compiladores a única coisa que podes fazer é software pipelining e reordenar as instruções de forma a maximizar a eficiência do processador.

Branch prediction é uma técnica em que é o próprio processador a decidir se vai efectuar o salto ou não! O compilador não sabe nem nunca terá essa informação em sua posse pois é algo que só se sabe aquando da execução do programa!

Algumas técnicas de branch prediction:

- predição estática. exemplo: salto é efectuado quando o endereço de destino do salto é inferior ao endereço da instrução de salto. Este tipo de saltos necessita de estudo prévio do pois depende e muito do programador/compilador.

- predição dinamica. este tipo de predição tem em conta todo o tipo de alterações decorrentes da execução do programa. Um exemplo deste tipo de técnica é uma Branch Prediction Buffer.

Muito importante: para existir branch prediction num processador é necessário que este o tenha implementado fisicamente, a isto não há volta a dar.

E já agora, uma cache é uma memoria local rápida...
 
Estava na secção PS3, daí que se entrou por aí; aliás se não estivesse na secção das consolas acho que nem o tinha visto.Exacto (e eu não costumo concordar contigo :p)

Há sempre uma 1ª vez para tudo... :p

Parece-me normal q ao falar do Cell, se fale de jogos, da PS3 e da 360, pq é aquela (q usando outras meios para o mesmo fim) com a qual se deve comparar resultados, mas é estranho considerar offtopic resultado final de jogos e a realidade PS3, quando se o Cell neste momento é falado por alguma razão neste mundo fora, é por ser um dos processadores usados neste momento numa consola, acho demasiado redutor debater a performance do Cell só através de benchmarks de computação...

Mas o autor do tópico n acha isso, e para pormenores técnicos de hardware tou fora...


A meu ver eles tiveram tudo na mão para fazer bem melhor ao esperarem mais um ano até lançarem a PS3, e perderam uma boa oportunidade, porque de facto, não creio que fosse difícil.

E com um ano a mais, n foi só nisso q falharam, mas isso sim já é offtopic... ;)
 
Mesmo que fosse workaround, qual seria o problema?

A tua tese inicial era que o Cell era desadequado para jogos. Continuas a não conseguir apresentar qualquer facto que a consiga apoiar. Lamento, mas simplesmente atirar opiniões para o ar é manifestamente insuficiente.

se o cell é assim tao potente e faz tao bem o trabalho de um GPU, porque é que ha jogos tao banais que nem a 720p correm? é preciso assim tantas provas? tens muitos jogos nas prateleiras...

Elas não têm cache, têm uma memória rápida local, e são capazes de branch prediction sim senhor, embora seja com auxílio do compilador.

qualquer pessoa que tenha feito um programa, nem que seja um Hello World tinha cabecinha suficiente para distinguir um codigo, compilador e programa final.

Como é que têm auxilio do compilador se as instruções sao executadas em runtime depois de terem sido compiladas? será que o cell anda a compilar código em função das necessidades a cada micro segundo? se essa tua teoria fosse verdade, acho que nem era preciso haver programadores! lol ...dammit...
 
Mesmo que fosse workaround, qual seria o problema?
Workaround=medida de recurso, não ideal.
Isto está-se a tornar um pouco idiota.

A tua tese inicial era que o Cell era desadequado para jogos. Continuas a não conseguir apresentar qualquer facto que a consiga apoiar. Lamento, mas simplesmente atirar opiniões para o ar é manifestamente insuficiente.
Então vou recapitular o ponto inicial:

Se alguma coisa e indo directamente ao centro da questão e utilização que ele tem na PS3 e jogos... é mais prejudicial eles terem mandado o general processing às couves, vocacionando o Cell para o que vocacionaram, do que benéfico em ter essa vocação.

Mantenho tudo o que disse, falta de factos? só se ignoraste tudo o que disse.
Não sei, diz-me tu?
Eu diria que gostarias de acreditar nisso; se insistes em dizer que antes diziam que era um Pentium 3 e agora já é orgulhosamente um bocadinho melhor que um P4 2.0 com 400 de fsb (e estamos a falar de uma PPE a 3.2 GHz)
Quem é que começou a dizer disparates como "leva uma coça" de um P4", só para depois mudar de discurso para "estão mais ou menos ao mesmo nível"?
Bom, para já, depende do Pentium 4 (e se formos acima dos 2.0 GHz ou mesmo, a mais fsb... ai não que não leva). Não mudei de discurso por muito que tentes pegar por aí.

P4 2.0 GHz é uma hiperbole, mas como podes constatar, é o que está mais perto nos benchmarks que me deste (e que já conhecia). Grande credibilidade que perdi.
Se não compreendes a diferença entre "levar uma coça" e "estar ao mesmo nível", então lamento, mas este diálogo torna-se demasiado imbecil, e podes continuá-lo sozinho.
Ok, o teu problema é que não leva uma "coça" mas sim "está ao mesmo nível", ok, está ao mesmo nível de um P4 2 GHz... wow; granda Cell.
Ninguém te obriga a lidar com as lacunas do Cell. Afinal de contas é uma plataforma da qual pareces saber muito pouco, para não dizer nada.
Sim, sim, boa tentativa de partir para o pessoal a ir para o que cada um de nós realmente sabe. Não alinho em levar coisas destas para o pessoal.
Nunca disse que era ideal. Foste tu quem levantou essa falsa (e irrelevante questão). O que interessa no final de contas é o desempenho na resolução dos problemas específicos com que se depara o programador.
A tua defesa do general purpose do Cell assenta que até uma gráfica pode ser eficiente para general processing; a reacção foi algo irónica sim, mas era esse o ponto que estavas a fazer.

Mas pronto então o que interessa é que o programador se desenvencilhe e perante adversidades arranje soluções, sem perder tempo e que essencialmente seja um John Carmack, aliás... equipas de 100 John Carmacks, procuram-se.
Tenho a sensação de que não sabes do que estás a falar. Afinal o que é que consideras general purpose, é o processamento de inteiros, são as instruções condicionais? Ambas?
Em que é que isto contribui para a discussão além de desconversar e tentar dispersar?
Já te expliquei que um FPU consegue processar inteiros. Se não consegues compreender algo tão simples não te posso ajudar.
Não me deste nenhuma novidade, facto é que isso não torna um "FPU" ideal para essa task.
Porque é rápida?
Para jogos? não mais rápida que os restantes na maior parte das tasks. E mesmo que fosse, estamos a falar de coisas que nos PC's, 1 ano depois onde é que já vão, já não estamos no tempo em que um bocadinho mais fazia toda a diferença; e isso sem duvida que não justifica a complexidade acrescida para as developers.
Quais handycaps? Só é handycap para quem tem medo de aprender coisas novas.
Handycap para mim é ter de andar a dar voltas com uma coisa que de outra forma seria bem mais simples. Mas para ti é "especialização do hardware" não posso fazer nada nesse sentido.

E "medo de aprender coisas novas" isso é muito fácil de dizer, mas na realidade implica pessoal treinado e especializado. Mais fácil dito que feito.
Nada do que disseste sobre o Cell foi fundamentado, muito pelo contrário. Toda a gente viu as contradições em que te embrulhaste.
Eles que leiam e tirem essas conclusões :rolleyes: não, não concordo contigo, mas também não vou partir para o que acho.
Que bom! O software funciona, mas o hardware...não.
Tu é que insististe em amandar a boquinha não relacionada. E o hardware neste momento já está bem melhorzinho nesse sentido.

De qualquer maneira não defendi a avaria, mas ao menos não vou buscá-las para justificar a lacuna de outra como sendo melhor. Até pode ser menos mau, sair com menos avarias, mas são entidades separadas para o que se está a discutir.
É esta a tua ideia de uma plataforma digna de investimento? Que ridículo.
Não disse que era digna de investimento, de qualquer maneira até acho que é, para já, tem mais unidades vendidas até à data que a PS3 e um bom tie ratio, mas de que interessa isto?
Ah, agora já passaram de "fraquissimas" a "menos que ideais".:-D
Same thing; não tenho de lhes estar sempre a chamar a mesma coisa.
Daqui a mais umas páginas se calhar já estás a dizer que são "razoáveisitas"... :lol:
Dificilmente.
Elas não têm cache, têm uma memória rápida local, e são capazes de branch prediction sim senhor, embora seja com auxílio do compilador.
Sabia que não tinha cache no verdadeiro sentido da palavra. Branch prediction com auxilio de um compilador... então estamos a falar de fazer "uma espécie" de branch prediction por software? bottleneck dos diabos... e não suporta branch prediction por hardware, que era o que se estava a dizer.

Dito isto, o que o HiGhVoIcE disse é uma resposta bem melhor.
A única coisa ideal neste mundo é a facilidade com que as pessoas decidem mandar opiniões sobre assuntos que desconhecem.
Comentários pessoais, abstenho-me de responder, aliás acho ideal não responder.
O Cell não é de forma alguma uma máquina perfeita. Mas é de longe melhor que a concorrência em tarefas de elevada carga de processamento, como foi demonstrado no teste da página inicial.

O resto é conversa.
tarefas de elevada carga de processamento em general purpose? nahhh, HPC, ou Scientific Computing, as coisas para que eles usam os Bluegenes, e efectivamente o Cell para isso é bom, melhor que CPU's para general processing. Mas isso não engloba todas as tarefas de "elevada carga de processamento" no verdadeiro sentido da expressão.

Mas de facto, o resto é conversa e acho que no que toca a isso esta thread já está a entrar na fase do "já deu o que tinha a dar".
 
Já te expliquei que um FPU consegue processar inteiros. Se não consegues compreender algo tão simples não te posso ajudar.

Bem, eu apenas passei uma rápida vista de olhos pelo teu ultimo post mas pelos vistos tenho de ler com mais atenção. Tu tens noção das coisas que dizes ou simplesmente inventas? É que não cabe na cabeça de ninguém meter uma FPU a calcular Inteiros! Além de a representação ser diferente, dos cálculos serem bastante mais complexos e ocupar mais área, também demoram mais tempo.

Outra pergunta importante para o contexto: será que foste introduzido ao conceito de pipeline? Uma unidade de inteiros (Adders, Shifters, Logic blocks) demora, em tempos standard, 1 ciclo de relógio a passar pela ALU. Uma unidade de FPU (Adders, Mults, Divs, etc) demora, por ex, 12 vezes mais. Como num processador o hardware é finito, vais ter aqui um major bottleneck, sendo necessário parar o pipeline - os algoritmos Out-of-order, como o Tomasulo (com uns pózinhos extra), só resolvem o número limitado de casos que o hardware implementado permitir.
 
Back
Topo