Gráfica nVidia Pascal (Mobile, TITAN Xp, GTX 1000 series)

V3ctor

Moderador
Staff
NVIDIA announces its tiny next-gen GPU, Pascal, with 3D Memory

GTC 2014 - NVIDIA has just unveiled its next generation GPU at its GPU Technology Conference in San Jose, California - Pascal. Don't let the name fool you, there's some incredible technology that has made Pascal possible.

36545_01_nvidia_announces_its_tiny_next_gen_gpu_pascal_with_3d_memory.jpg

Pascal has three key technologies that have made it possible, NVLink, 3D Memory and a new Module size - one-third the size of a PCIe card. NVLink provides some incredible bandwidth - where it will provide up to 5-12x the bandwidth of PCIe 3.0, which NVIDIA expects to see 1TB/sec memory bandwidth by 2016 thanks to the next technology, 3D Memory.

36545_02_nvidia_announces_its_tiny_next_gen_gpu_pascal_with_3d_memory.jpg


3D Memory is something that has been coming for quite sometime, but it will provide 2-4x memory bandwidth, and its extremely small. This helps NVIDIA's next-gen Pascal GPU to be just one-third the size of standard GPU - such as the just-released GeForce GTX TITAN Black GPU.

NVIDIA co-founder and CEO, Jen Hsun Huang took the stage, announcing that this new Pascal GPU will arrive to PCs in the near future, and you can be sure we'll have more news on it as it happens.
 
Anuncio importante.

- Pela foto, além de 3D Memory, terá on-package memory, junto do GPU, que terá ainda mais bandwidth que a memória principal. As duas coisas já se sabiam que iam ser usadas pela Intel (Na verdade, L4 já é usado no Haswell R).
- NVLINK é interessante, não só pelo aumento da bandwidth como coerência a partir da segunda geração. Eu diria que devia ter coerência desde a primeira geração. O problema que vejo é a aceitação por parte da AMD e Intel do NVLINK. Não estou a ver integrarem no cpu este bus, por isso ainda não percebo como vai ser colocado no mercado. A não ser que o cpu seja um ARM da nVidia.
 
Pois, o NVLink é que não percebo. Talvez venham a existir boards com compatibilidade especifica.

E o tamanho reduzido... Não poderá vir a trazer problemas de cooling?
Mesmo com os consumos reduzidos, não acredito que nos topo de gama venham a reduzir assim tanto.
 
Pois, o NVLink é que não percebo. Talvez venham a existir boards com compatibilidade especifica.

Não faz sentido. Repara, vamos imaginar um chipset com NVLINK. Como é que depois o chipset se liga ao cpu? DMI, que actualmente não é mais que Pci-Ex. Logo, voltava-se a ter aí o bottleneck.
O NVLINK para funcionar, especialmente com coerência, tem que ter suporte por parte do cpu. E é aí que não percebo este anúncio.
Anunciar o NVLINK sem um cpu que o suporte, não faz sentido.

Não vejo outra solução. Das duas uma:
- AMD e Intel vão suportar NVLINK. Ficaria muito surpreendido.
- A nVidia vai lançar um cpu para servidores. Se quiserem suportar NVLINK em Desktops, então um cpu também para desktops.

E o tamanho reduzido... Não poderá vir a trazer problemas de cooling?
Mesmo com os consumos reduzidos, não acredito que nos topo de gama venham a reduzir assim tanto.

Não ligues muito por enquanto aquele tamanho. Aquilo é uma board de desenvolvimento e aposto que para um Tesla. O Intel Phi já tem versões mais ou menos com aquele tamanho. Parecem uma placas MXM, com cooler passivo, em que as fans do servidor arrefecem o GPU.

XeonPhi2.png


Do que foi mostrado do Pascal, penso que tem como target o mercado de servidores. O NVLINK deixa-me a pensar. Não vejo outra hipótese que não a nVidia lançar um cpu.
 
Última edição:
Alguns detalhes via Anandtech:

Along with a GPU-to-GPU link, NVIDIA’s plans include a more ambitious CPU-to-GPU link, in large part to achieve the same data transfer and synchronization goals as with inter-GPU communication. As part of the OpenPOWER consortium, NVLink is being made available to POWER CPU designs, though no specific CPU has been announced. Meanwhile the door is also left open for NVIDIA to build an ARM CPU implementing NVLink (Denver perhaps?) but again, no such product is being announced today.

http://anandtech.com/show/7900/nvidia-updates-gpu-roadmap-unveils-pascal-architecture-for-2016

Temos os Power a suportar NVLINK, mas parece-me muito pouco, mesmo para o mercado de servidores. Se querem mais, têm que anunciar um cpu da própria nVidia.
 
Faz e são processadores muito bons, mas completamente fora do alcance do comum consumidor e mesmo da comum empresa. Também ainda tem fábricas.

Faz os Power. O próximo é o Power8 e é uma beleza:
http://www.theregister.co.uk/Print/2013/08/27/ibm_power8_server_chip/

Como disse, são excelentes processadores, mas cada vez mais um nicho. Não acredito que a nVidia crie o NVLINK só a pensar nos Power.

Muito bom . Gostei do titulo : " You won't find this in your phone" :D
 
Muito bom . Gostei do titulo : " You won't find this in your phone" :D

Este em particular não, nem de perto, mas PPC é muito usado no mercado embedded. Por exemplo a Nintendo Wii ainda usa PPC. Controladoras Raid da LSI são PPC, entre muitos outros exemplos.
Em telemoveis, não me recordo de nenhum exemplo onde tenha sido usado PPC.

O ano passado foi criada uma aliança à volta de PPC. Estão a tentar ganhar maior relevância no mercado. No entanto não vejo a nVidia a apostar algo tão importante como o NVLINK só no mercado PPC.

A Intel tem o QPI e não estou a ver a aliar-se à nVidia no NVLINK.

A minha aposta vai que no mercado de servidores HPC a nVidia aposte o NVLINK com PPC e um cpu ARM próprio. Faz todo o sentido.
No mercado consumidor, o NVLINK pode ser usado para agregar GPUs como é feito com o SLI, mas com um bus mais rápido. Falta saber se a nVidia tem coragem de lançar um cpu próprio no mercado consumidor que aproveite o NVLINK.
 
De certeza que a nVidia está a pensar no Project Denver. Estes ARM's servem apenas como pontes de ligação entre os gpus.

Além de que já está a tentar implementar este bus, anos antes do GPU "Volta" que irá usar esse tipo de bus. Com a tech implementada anos antes (negociar com fabricantes de motherboards?) a chegada dos GPU's Volta será simples e com uma plataforma já estudada e com bugs "ironed out". Isto no mercado de consumidor.

A Intel não deve permitir o NVLink nos seus cpu's, era basicamente dar o mercado dos servidores à nVidia, tendo os seus próprios CPU's "set aside", servindo apenas para calculos básicos.
 
Nos meus posts esqueci-me de dois pontos do lado da Intel.

- Primeiro, segundo os rumores do Intel Knights Landing (Próxima versão do Xeon Phi) haverá uma versão bootable. Isto é, num sistema single socket não há inter connect entre o Gpu e Cpu, porque ele é o Cpu. Um conjunto grande de processadores X86 na mesma die com unidades vectoriais AVX-512.
- Mas quando é preciso ligar multiplos Intel Knights Landing (Super computadores) há uma solução, que não é o QPI. A Intel em 2012 comprou a unidade de Inter connect da Cray, mais os seus 74 empregados. Os interconnects da Cray são coerentes ao contrário da primeira versão do NVLINK.

Mas isto tudo da Intel é no mercado Servidores HPC. Faz sentido o NVLINK nesse mercado.

Não estou totalmente convencido que o NVLINK venha para o mercado consumidor, ligando-se ao Cpu. Entre as gráficas (SLI) faz sentido.
Com cpus da Intel, não vejo como possa funcionar. No fim, tem que haver sempre um link para o processador. E, ou há um bottleneck, ou um link da Intel que tenha a mesma capacidade e por agora, publicamente não há nada parecido por parte da Intel para o mercado consumidor.
No mercado consumidor, NVLINK entre o cpu e gpu só faz sentido se a nVidia lançar um cpu próprio e é neste ponto que não sei se eles têm coragem para tal. Atenção, não falo de um ARM mobile. Algo que faça frente aos processadores desktop da Intel.
 
O NVLink deixa-me com bastantes sensações de deja vu, é o AGP outra vez, ligação especial para gráficas, em vez do multi-usos e mais capaz pci-e. E para não variar da parte da NVIDIA, é uma solução proprietária...

Tirando isso, a parte do GPU eficiente espremido parece-me bem.
 
But missing from the product road map on a conference presentation slide was a
GPU code-named Volta, which was announced last year and originally due to
succeed Maxwell. Volta was to have 3D memory stacking and unified memory.
Nvidia did not explain why it killed plans for release of the original Volta,
but the company has retained the code name.

"Volta will be our next GPU after Pascal," Nvidia spokesman Ken Brown wrote
in an email message. "Pascal switched places with [Volta]."


Pascal was moved up because Nvidia had a "unique opportunity to create a new
GPU architecture right after Maxwell with three key new technologies," Brown
said. Those technologies are 3D memory stacking, shared CPU and GPU memory, and
NVLink, an interconnect that provides faster throughput.
http://www.computerworld.com/s/arti...essor_but_delays_Volta_GPU_Parker_mobile_chip
 
Informações renovadas no GTC2015

GTC 2015: NVIDIA Roadmap Shows Pascal with 3D Memory, NVLink and Mixed Precision Compute

At the keynote of the GPU Technology Conference (GTC) today, NVIDIA CEO Jen-Hsun Huang disclosed some more updates on the roadmap for future GPU technologies.



roadmap.jpg



Most of the detail was around Pascal that will introduce three new features including mixed compute precision, 3D (stacked) memory, and NVLink. Mixed precision is a method of computing in FP16, allowing calculations to run much faster at lower accuracy than full single or double precision when they are not necessary. Keeping in mind that Maxwell doesn't have an implementation with full speed DP compute (today), it would seem that NVIDIA is targeting different compute tasks moving forward. Though details are short, mixed precision would likely indicate processing cores than can handle both data types.

3D memory is the ability to put memory on-die with the GPU directly to improve overall memory banwidth. The visual diagram that NVIDIA showed on stage indicated that Pascal would have 750 GB/s of bandwidth, compared to 300-350 GB/s on Maxwell today.

NVLink is a new way of connecting GPUs, improving on bandwidth by more than 5x over current implementations of PCI Express. They claim this will allow for connecting as many as 8 GPUs for deep learning performance improvements (up to 10x). What that means for gaming has yet to be discussed.



roadmap2.jpg



NVIDIA made some other interesting claims as well. Pascal will be more than 2x more performance per watt efficient than Maxwell, even without the three new features listed above. It will also ship (in a compute targeted product) with a 32GB memory system compared to the 12GB of memory announced on the Titan X today. Pascal will also have 4x the performance in mixed precision compute.
 
Nvidia Pascal 10X Faster Than Maxwell – Due in 2016 on 16nm Featuring 3D Memory, NV-Link and Mixed Precision
Hardware 4 hours ago by Khalid Moammer
Pascal will feature 4X the mixed precision performance, 2X the performance per watt, 2.7X memory capacity & 3X the bandwidth of Maxwell.

Those are a lot of numbers to digest indeed so lets break them down. Nvidia states that pascal will be the company’s first high performance GPU to feature mixed precision floating point compute FP16. Which is essential for low power devices such as tablets and mobile phones. Mixed precision is also very beneficial from a power efficiency stand point for many compute applications which don’t strictly require higher precision FP32 or FP64 compute which would benefit greatly from this addition.

Nvidia : Pascal is 10X Faster Than Maxwell – Features Mixed Precision, 3D Memory and NV-Link Coming in 2016
Nvidia’s CEO went on to state that pascal will be 10 times faster than Maxwell and he arrived at this conclusion via what he calls “CEO math”. Obviously this was just a humorous way to impress the crowd at GTC 2015 and is based on “very rough estimates”.


Pascal will feature three distinct new technologies.

#1 HBM : Stacked memory will debut on the green side with Pascal. HBM Gen2 more precisely, the second generation of the SK Hynix AMD co-developed high bandwidth JEDEC memory standard. The new memory will enable memory bandwidth to exceed 1 Terabyte/s which is 3X the bandwidth of the Titan X. The new memory standard will also allow for a huge increase in memory capacities, 2.7X the memory capacity of Maxwell to be precise. Which indicates that the new Pascal flagship will feature 32GB of video memory, a mind-bogglingly huge number.



We’ve already seen AMD take advantage of this memory technology with its R9 390X GPU. Which will feature up to 8GB of HBM delivering 640GB/S of memory bandwidth. Nearly three times that of the GTX 980 and twice that of the GTX Titan X. AMD has also stated that it plans to use the second generation of this new memory technology in future graphics cards. So we’re likely to see both red and green rocking second generation stacked HBM next year.

HBM achieves this amazing improvement in memory bandwidth and capacity by employing a very wide through-silicon-via memory interface. Each HBM cube is connected to the GPU with a 1024bit wide memory bus. HBM modules actually operate at low frequencies compared to GDDR5 but thanks to the significantly wider memory interface they manage to be up to 9 times faster than standard GDDR5 memory modules.

We’ve already covered this revolutionary new memory technology exclusively and in-depth last year. HBM will quickly replace GDDR5 as the standard memory technology for high performance graphics solutions. It’s fair to say that HBM is the future.

#2 NV-Link : Pascal will also be the first Nvidia GPU to feature the company’s new NV-Link technology which Nvidia states is 5 to 12 times faster than PCIE 3.0.

NVIDIA® NVLink™ is a high-bandwidth, energy-efficient interconnect that enables ultra-fast communication between the CPU and GPU, and between GPUs. The technology allows data sharing at rates 5 to 12 times faster than the traditional PCIe Gen3 interconnect, resulting in dramatic speed-ups in application performance and creating a new breed of high-density, flexible servers for accelerated computing.

#3 16nm manufacturing process : Pascal will the first Nvidia GPU to be built on TSMC’s 16nm FinFET manufacturing process. The new process promises to be significantly more power efficient and significantly more dense than 28nm. Which would enable Nvidia to build significantly more complex and powerful GPUs all the while significantly improving power efficiency.

TSMC’s 16FF+ (FinFET Plus) technology can provide above 65 percent higher speed, around 2 times the density, or 70 percent less power than its 28HPM technology. Comparing with 20SoC technology, 16FF+ provides extra 40% higher speed and 60% power saving. By leveraging the experience of 20SoC technology, TSMC 16FF+ shares the same metal backend process in order to quickly improve yield and demonstrate process maturity for time-to-market value.

Pascal is still scheduled for a 2016 release with Volta coming along sometime after that.



Read more: http://wccftech.com/nvidia-pascal-features-mixed-precision-3d-memory-nvlink/#ixzz3UgH5QsnG

http://wccftech.com/nvidia-pascal-features-mixed-precision-3d-memory-nvlink/
 
Sendo leigo nesta matéria o que vejo é que o CPU vai limitar e muito os GPU's no futuro, mesmo os processadores mais recentes e potentes.
Se o DX12 não retirar do cpu a carga que o DX11 o obriga actualmente vamos estar cada vez mais limitados pelos processadores a não ser que a Intel/AMD saquem da cartola algo com mais capacidade para acompanhar os gpu's que cada vez são mais poderosos e eficientes, chega-se a um ponto em que provavelmente mais vale riscarem os CPU's da equação e passar todo o processamento para o GPU ou vários GPU's.
Se analisarmos bem as coisas o que vemos é que o poder do GPU é desperdiçado, pois pelo que os gráficos acima demonstram o GPU está a milhas de distância em termos de transferência de dados, o pci-e, o cpu e mesmo as novas ddr4 parece que comunicam por código morse comparado com o GPU, mesmo as velocidades de transferência de dados do NV link não me parecem suficientes para retirar todo o potencial dos futuros GPU's.
 
Sendo leigo nesta matéria o que vejo é que o CPU vai limitar e muito os GPU's no futuro

Nem por isso. Estes gpus vão servir para puxar frames decentes a resoluções muito elevadas, tipo 2560p, 4k. Para isso, até os cpus actuais servem.
Agora, se queres usar isto para jogar a 500fps a 1080p, és capaz de não conseguir, sim. Mas tb não vejo a utilidade disso. ;p
 
A questão é perceber o que tem impacto onde. O CPU importa na simulação, e o GPU no cálculo visual. As simulações de base não vão crescer assim tanto de peso pelo aumento da resolução, portanto penso que o CPU não será dos maiores limitadores para subir na resolução. Já o cálculo visual sim, pois vais ter uma área maior para mostrar. E aí é como disse o SideWalker, estas melhorias nos GPU's acima de tudo são boas para manter boas opções com resoluções maiores. A parte do CPU só deve crescer mais quando o cálculo da física é feito nele, mas a simulação em si não deve crescer assim tanto (cresce um pouco, mas nada por aí).
 

Pois, como disse anteriormente sou um leigo neste assunto, mas pelo que percebi e por isso ter escrito o que escrevi, para que tudo aquilo que a nvidia anuncia funcione vão ter de mudar de forma dramática o funcionamento do resto do pc.
Não podemos meter um motor V12 de um ferrari num fiat 500 sem mudar o resto do carro...
 
Back
Topo