Gráfica AMD RDNA2 (RX 6000 series)

Código:
.
.
+#define SDMA0_UTCL1_PAGE__LLC_NOALLOC__SHIFT
.
.

https://lists.freedesktop.org/archives/amd-gfx/2020-October/055005.html

Código:
[PATCH 2/3] drm/amdgpu: add support to configure MALL for sienna_cichlid (v2)
.
.
Enable Memory Access at Last Level (MALL) feature for sienna_cichlid.
.
.
+ * 58 reserved and for sienna_cichlid is used for MALL noalloc

https://lists.freedesktop.org/archives/amd-gfx/2020-October/055006.html

Código:
Enable Memory Access at Last Level (MALL) feature for display.
.
.
+            // TODO: remove hard code size
+            if (surface_size < 128 * 1024 * 1024)
.
.

https://lists.freedesktop.org/archives/amd-gfx/2020-October/055007.html

LLC deve ser "Last Level Cache"

MALL tem lá que é "Memory Access at Last Level"

sienna_cichlid é o codename da Navi21 ou de um dos modelos. Já não me lembro.

128 x 1024 x 1024 = 134217728
Por acaso 134217728 é o número de bytes em 128 MB. :wink:
 
Última edição:
Código:
.
.
+#define SDMA0_UTCL1_PAGE__LLC_NOALLOC__SHIFT
.
.

https://lists.freedesktop.org/archives/amd-gfx/2020-October/055005.html

Código:
[PATCH 2/3] drm/amdgpu: add support to configure MALL for sienna_cichlid (v2)
.
.
Enable Memory Access at Last Level (MALL) feature for sienna_cichlid.
.
.
+ * 58 reserved and for sienna_cichlid is used for MALL noalloc

https://lists.freedesktop.org/archives/amd-gfx/2020-October/055006.html

Código:
Enable Memory Access at Last Level (MALL) feature for display.
.
.
+            // TODO: remove hard code size
+            if (surface_size < 128 * 1024 * 1024)
.
.

https://lists.freedesktop.org/archives/amd-gfx/2020-October/055007.html

LLC deve ser "Last Level Cache"

MALL tem lá que é "Memory Access at Last Level"

sienna_cichlid é o codename da Navi21 ou de um dos modelos. Já não me lembro.

128 x 1024 x 1024 = 134217728
Por acaso 134217728 é o número de bytes em 128 MB. :wink:

Sim é mesmo. 128mb infinity cache na navi 21.
 
Já no CPU das consolas, também sacrificaram a cache L3, para manter o tamanho do SoC mais pequeno.

Ter esses 128MB de cache extra, explica o porquê de ter apenas um bus de 256 bits em GDDR6.
 
O problema é que o espaço num SoC é muito limitado.
Numa gráfica e/ou CPUs dedicados, existe muito mais liberdade para colocar mais cache.
 
Também nao sei o espaço que a cache vai ter, mas ter 384 bits ou mais também tem a desvantagem de ocupar espaço no PCB e acrescer bastante o preço e acima de tudo, subir consideravelmente os consumos, ainda que a cache nao seja barata.

Honestamente espero que alguem faça uma boa analise da arquitetura, isto porque estou muito curioso do que na prática isto vai conseguir.

A AMD quando usava GCN tinha sempre mais bits de memoria que a nvidia, porque a nvidia sempre teve melhor compressão de memória e nunca teve necessidade de usar muitos bits ou memorias ultra rápidas para conseguir conseguir igualar o bandwidth prático da AMD, isto porque bandwidth teorico, muitas vezes a AMD duplicava a nvidia, mas na pratica, não se traduzia nisso.

A AMD entretanto foi evoluindo bastante a compressão de memória, mas ainda assim tenho ideia de estar uns furos atrás da nvidia.
Agora ver a AMD com menos/mesmo bandwidth teorico para ir contra a nvidia, com a arquitetura que a nvidia tem e a evolução que tem tido nas compressões... Epáahhh não sei.

Ou isto da cache na AMD resulta mesmo ou as gráficas vão andar cheias de fome por largura de banda.
 
A AMD entretanto foi evoluindo bastante a compressão de memória, mas ainda assim tenho ideia de estar uns furos atrás da nvidia.
Agora ver a AMD com menos/mesmo bandwidth teorico para ir contra a nvidia, com a arquitetura que a nvidia tem e a evolução que tem tido nas compressões... Epáahhh não sei.

Ou isto da cache na AMD resulta mesmo ou as gráficas vão andar cheias de fome por largura de banda.

Em termos de compressão, creio que até regrediu. Se formos a ver os testes de compressão do site anandtech, dá para ver que as Navi quase não fazem compressão de dados.
As melhorias das Navi1 parecem ser mais relacionadas com a passagem para um sistema de renderização por tiles e melhor uso de caches.

111341.png


111342.png
 
Sim, mas não ao ponto de termos praticamente zero compressão.
Por exemplo, as gráficas da nvidia perdem um pouco menos de desempenho, à medida que sobre a resolução.
E também costumam gastar um pouco menos de vram.

Mas pode ser que com as RDNA2, esta situação seja invertida.
Pelo menos pelos leaks que temos, parece que temos isso.

Já fazia muito tempo que não ficava tão entusiasmado com uma apresentação de GPUs da AMD.
Apenas espero que seja tudo verdade e tenhamos bomba.
 
Já fazia muito tempo que não ficava tão entusiasmado com uma apresentação de GPUs da AMD.
Apenas espero que seja tudo verdade e tenhamos bomba.

Também me parece que desta vez acertaram na fórmula e vem ai uma gráfica para competir a sério com a Nvidia.

As diferenças vão passar a ser basicamente as features extra que cada uma delas oferece.
 
Back
Topo