No caso da nVidia parece que temos um problema de CPU overhead em DX12. As drivers da nVidia submetem instruções ao GPU com um scheduler em software, enquanto que a AMD tem um scheduler por hardware.
Como o jogo tem um foco sobre uma thread principal, o resultado é um bottleneck para a driver da nVidia.
Se formos a ver nas gráficas de game média, a GTX 1060 fica perto da RX 580, mesmo sendo um jogo que gosta de AMD.
Ou seja, aqui o bottleneck da driver não se mostra tanto, pois o GPU é que está a limitar.
Na GTX 1080 já se nota um bocado e na 1080Ti, ainda mais.
O que é de notar é que este é o primeiro jogo que realmente mostra os TFLOPs da Vega a trabalharem. Neste caso, o factor limitativo do GPU, não é o scheduler, nem geometria, nem largura de banda de memória, mas apenas peak shader arithmetic throughput.
Com o aumentar da resolução, a Vega perde para a 1080Ti, pois nessas resoluções o bottleneck passa para o pixel fillrate e largura de banda de memória. A Vega e a 1080 Ti têm a mesma largura de banda de memória, mas a nVidia ainda tem vantagem com um sistema de coulor compression mais avançado.
E em termos de pixel fill rate, a GTX 1080 Ti, tem quase 40% mais do que a Vega.