• NAVI 21

Navi 21, est le premier GPU à étrenner l'architecture RDNA2. Il était souvent affublé du terme Big Navi par le passé, lorsqu'on souhaitait parler de la future puce haut de gamme de génération Navi. Son sobriquet ne mentait pas, puisqu'elle mesure pas moins de 519 mm² tout en étant gravée par TSMC, à l'aide de son process 7 nm. C'est donc un beau bébé, plus grand que Vega 10 par exemple, certes moins imposant que les dernières créations du caméléon, mais utilisant un procédé de fabrication plus performant.  

 

die navie21 t [cliquer pour agrandir]Navi 21 dans toute sa splendeur

 

Il est toutefois utile et important de préciser qu'à ce niveau, il n'y a pas un, mais des 7 nm disponibles chez TSMC. Après l'introduction initiale de ce nœud de gravure, une version "Performance" est apparue (augmentant densité et efficacité énergétique), puis une version "+" a été lancée utilisant l'EUV, pour là aussi améliorer ces deux points, ainsi que le rendement de production. AMD n'est pas prolixe sur le sujet, tout juste retrouvons-nous sur le slide suivant la phrase "same 7 nm technology", sans savoir exactement si cela signifie ici le même nœud de gravure ou la même déclinaison au sein de ce dernier. Toutefois, AMD insiste sur le fait que les gains seraient à mettre au crédit des évolutions architecturales, allant dans le sens de la première hypothèse.

 

7nm t [cliquer pour agrandir]

 

Si concernant la performance des transistors de chaque procédé de gravure, on ne peut que se baser sur les dires des fondeurs et concepteurs, pour la densité, les informations d'AMD et Nvidia permettent de réaliser des ratios entre GPU. Même si cet élément n'a pas grande importance pour le client final, il permet de se faire une petite idée des coûts de production.

 

Gravure
GPUNombre de transistorsSuperficie Die

Densité (Millions de transistors / mm²)

7 nm TSMC GA100 54,2 Milliards 826 mm² 65,6
7 nm TSMC Navi 21 26,8 Milliards 520 mm² 51,6
8 nm Samsung GA102 28,3 628 mm² 45
8 nm Samsung GA104 17,4 392 mm² 44,3
7 nm TSMC Navi 10 10,3 Milliards 251 mm² 41
7 nm TSMC Vega 20 13.2 Milliards 331 mm² 39.9
16 nm TSMC GP102 12 Milliards 471 mm² 25,5
14 nm GF Vega 10 12,5 Milliards 495 mm² 25,3
16 nm TSMC GP100 15,3 Milliards 610 mm² 25.1
12 nm TSMC TU102 18,6 Milliards 754 mm² 24,7
12 nm TSMC TU100 21,1 Milliards 815 mm² 24,3

 

D'après les chiffres communiqués, la densité de Navi 21 serait légèrement supérieure à celle de GA102 gravée en 8 nm (node 10 nm optimisé) par Samsung, mais bien moindre que celle de GA100, utilisant lui le 7 nm de TSMC. Toutefois, ces GPU ne visant pas du tout les mêmes usages, cela a pour conséquence des designs bien différents (cache L2 bien plus important sur GA100, probablement pas de moteur d'affichage intégré, etc.) qui peuvent impacter significativement la densité. Les versions du 7 nm sont peut-être différente également. On remarquera toute de même le gain à ce niveau de Navi 21 par rapport à Navi 10 ou Vega 20, utilisant pourtant eux-aussi le même nœud de TSMC. Voilà qui ajoute encore de l'incertitude quant à la version du 7 nm utilisée, même si là aussi, le design de la puce peut expliquer cette différence de densité (en particulier avec l'adjonction de la grosse quantité de cache). Trois cartes graphiques sont déclinées depuis ce GPU, selon le niveau d'activation des unités.

 

NAVI 21RX 6900 XTRX 6800 XTRX 6800
Shader Engine 4 4 3
CU 80 / 80 72 / 80 60 / 80
SP 5120 4608 3840
TMU 320 288 240
Ray Accelerator 80 72 60
ROP 128 128 96
Cache L2 (Mo) 4 4 4
Infinity Cache (Mo) 128 128 128
Bus mémoire (bits) 256 256 256

 

Ainsi, la RX 6900 XT utilisera la version intégrale de Navi 21, alors que la RTX 3090 par exemple, utilise une puce partiellement bridée (2 SM désactivé soit 98% du total tout de même). Plus bas dans la gamme, la RX 6800 XT emploie une puce avec 90% des unités activées et un bus mémoire intégral, soit significativement plus que la RTX 3080 FE en comparaison (81% des unités de calculs actives et 83% du bus mémoire). Enfin, la RX 6800 voit de son côté la désactivation d'un Shader Engine, soit 25% de la puissance de calcul, texturing, rastérisation et géométrie. Elle conserve par contre un bus mémoire inchangé, tout comme le cache l'accompagnant (L2 et Hyper Cache). Jetons à présent un coup d'œil à la macro organisation du GPU. Cette dernière est relativement similaire à ce que l'on retrouve pour Navi 10.

 

diagram navi21 t [cliquer pour agrandir]

 

Un processeur de commande central est chargé de planifier et ordonner les différents threads, à ses côtés se trouvent les unités chargées de l'organisation et de la gestion des tâches Compute, ainsi qu'un processeur géométrique central. Tout ceci est complété par diverses interfaces et moteurs de gestion (vidéo, encodage/décodage). La hiérarchie des caches évolue comme nous l'avons vue page précédente, puisqu'en sus des 4 Mo de L2 centralisés, on retrouve le niveau supplémentaire appelé Hyper Cache par le marketing d'AMD et comprenant pas moins de 128 Mo, par le biais de 2 partitions en liaison directe avec les contrôleurs mémoire.

 

Enfin, l'exécution des programmes est réalisée au sein de 4 Shaders Engine, chacun disposant de leurs propres cache L1, unité de rastérisation (découpe des triangles en pixels), Primitive Unit (génération et traitement des triangles), ainsi que 32 ROP (unité de rendu/sortie) et 10 Dual Compute Unit comprenant comme leur nom l'indique, 2 CU. Ces deux derniers éléments voient leur nombre doublé par rapport à Navi 10. Ces évolutions conduisent à une progression sensible de la performance par cycle, tout en réduisant la consommation nécessaire à chacun de ces derniers. En couplant cela avec l'augmentation de fréquence, on obtient une puce non seulement bien plus performante, mais aussi plus efficace énergétiquement.

 

perfw t [cliquer pour agrandir]

 

On peut donc schématiser Navi 21, comme étant un Navi 10 élargi au niveau du nombre de ses unités de calcul et auquel on a greffé un cache L3 (Hyper Cache), tout en augmentant sensiblement sa fréquence de fonctionnement.

 

sources gains t [cliquer pour agrandir]

 

AMD indique également avoir travaillé l'efficacité énergétique de sa carte durant les phases de repos. Ainsi, la consommation lorsque le moniteur est éteint, serait réduite de près de moitié par rapport à Navi 21. Pas de trace par contre d'une quelconque amélioration de la consommation au repos avec plus d'un écran, un point décevant du côté de Navi 10. Nous vous renvoyons à la page consommation, pour voir ce qu'il en est des nouvelles venues à ce niveau.

 

conso idle t [cliquer pour agrandir]

 

Abordons à présent le point qui a surpris de nombreuses personnes lors de son annonce par AMD, à savoir savoir le Smart Access Memory, à traduire par accès mémoire intelligent, une désignation bien marketing s'il en est. De quoi s'agit-il en réalité ? En fait, de l'activation d'une fonctionnalité de la norme PCIe, standardisée depuis des années par le consortium PCI-SIG, mais non utilisée par les GPU jusqu'à présent : le resizable BAR (Base Adress Register). A l'origine, l'adressage mémoire 32-bit étant limitant, seuls 256 Mo de mémoire vidéo étaient accessibles simultanément par le CPU. Malgré le passage à l'ère 64-bit, ce mode de fonctionnement a été conservé (probablement par habitude), puisque des solutions pour le contourner existaient. AMD a toutefois vu ici une source de gains potentiels, en utilisant ce resizable BAR, libérant l'accès à l'intégralité de la mémoire vidéo pour le processeur, sans avoir à jongler par tranche de 256 Mo.

 

sma2

 

C'est donc une bonne idée et compatible théoriquement avec de nombreuses configurations, puisqu'il suffit normalement d'avoir une configuration UEFI fonctionnant en mode "natif". Cela implique toutefois de désactiver CSM (Compatibility Support Module), qui permet d'émuler un "fonctionnement BIOS" pour booter avec des périphériques plus anciens et une table de partitionnement MBR (Master Boot Record), au lieu du plus récent et sécurisé GPT (GUI Partition Table). Seulement, AMD indique que son Smart Access Memory ne fonctionne que sur plateforme avec chipsets série 500 et processeurs série 5000, soit la dernière génération. Rien ne justifie à priori une telle segmentation, et Nvidia vient d'apporter de l'eau au moulin, en indiquant travailler sur une mise à jour de ses pilotes, proposant la prise en charge du resizable BAR pour des des gains du même ordre, mais surtout beaucoup moins restrictifs en termes de plateformes supportée... Wait & see donc, si l'assertion des verts s'avère véridique, AMD sera probablement contraint de se montrer plus ouvert lui aussi. Poursuivons par un sujet poussé par les rouges depuis le lancement de Navi en juillet 2019, la latence en jeu.

 

Technologie d'amélioration de la latence par AMD [cliquer pour agrandir]

 

Après avoir introduit Anti Lag, AMD a lancé quelques mois plus tard Radeon Boost. Ce dernier correspond en fait à un système de définition dynamique, permettant donc d'augmenter le nombre d'images par secondes et réduisant ainsi la latence lors des mouvements rapides. C'est bien-sûr au prix d'une dégradation de la qualité visuelle, mais compte-tenu du flou de mouvement, l'impact est peu sensible selon les rouges (et les joueurs compétitifs s'attachent rarement à ce point). AMD indique que ses propres solutions permettent de devancer la concurrence, nous tâcherons à l'avenir de vérifier ce point via l'utilisation de LDAT. Finissons notre tour d'horizon, par les capacités multimédia de ce nouveau GPU.

 

VP9H.264H.265

AV1

Decodage

4K90

8K24

1080P600

4K150

1080P360

4K90

8K24

8K30
Encodage -

1080P360

4K90

1080P360

4K60

-

 

On notera principalement l'ajout du décodage matériel pour le codec AV1, jusqu'à 8K en 30 i/s. Pas de mention par contre (AMD a été très peu loquace sur cette partie) d'une éventuelle prise en charge de l'encodage H.265 B Frame, un des avantages de l'encodeur du caméléon, en sus de la qualité de sortie. Côté moteur d'affichage vidéo, à l'instar des cartes Ampere, Navi 21 gère les normes DP 1.4a avec DSC, ainsi que l'HDMI 2.1. Ce dernier permet l'affichage jusqu'en 8K en 60 Hz et 4K 144 Hz. Voilà c'est terminé pour cette partie, passons à la description des cartes de test à présent.



Plus d'infos avec le comptoir de l'info


Les 158 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !