• VEGA 20

Pour ceux intéressés par l'architecture Vega, nous vous invitons à lire ou relire la page que nous lui avions consacrée lors du dossier dédié à la RX Vega64. Résumée en quelques lignes, cette dernière s'appuie toujours sur GCN  (Graphics Core Next) intronisé avec les Radeon HD 7900, même si AMD a fait disparaître toute référence à cette dénomination pour l'architecture. On peut toutefois considérer Vega comme étant la 5ème itération de GCN, avec des évolutions au niveau des unités de calculs supportant à présent la 1/2 précision (FP16) à double vitesse.

 

Rendu die Vega 20 [cliquer pour agrandir]

 

Les unités de rastérisation progressent également en adoptant le DSBR (Draw Stream Bining Rasterizer), pouvant générer des gains opportunistes via Tiled Rendering. Le cache L2 centralisé est également doublé, et diverses optimisations sont apportées pour la géométrie (Primitive Shader) ou l'IA (instructions spécifiques au Deep Learning). Enfin, un grand nombre de transistors a été dédié pour permettre de monter davantage en fréquence (redondance du signal, contrôle et correction d'erreurs, etc.). Voilà pour l'architecture, en tout cas celle déclinée dans le seul GPU dédié disponible, alias Vega 10.

 

Il a été rejoint en fin d'année dernière par Vega 20, un GPU très proche mais qui diffère toutefois en quelques points. AMD ne nous ayant pas communiqué de diagramme de cette nouvelle puce, nous avons modifié celui fourni lors du lancement de la Vega64. La principale nouveauté est l'utilisation de 4 piles HBM 2 au lieu de 2 sur la précédente déclinaison. Cette modification a un impact notable concernant la bande passante mémoire, puisque le bus passe de 2048-bit à 4096-bit ! Par contre, les unités de rendu (ROP) restent inchangées à 64, une valeur n'ayant plus évolué depuis Hawaii.

 

Diagramme Vega 20 (supputé) [cliquer pour agrandir]

 Diagramme simulé de Vega 20

 

Toujours au niveau des différences séparant Vega 20 de son prédécesseur, les unités de calcul évoluent également. En effet, en sus des demi-précision (FP16 à double vitesse) et simple précision (FP32), elles sont à présent capables de réaliser la double précision (FP64) avec un ratio d'1/2 par rapport à la SP. Cette fonctionnalité n'a aucun intérêt d'un point de vue ludique, mais les professionnels pourront y trouver une utilité pour certaines tâches. Ceux y voyant une opportunité d'économie à ce niveau, par rapport à une coûteuse MI50/60 devront vite déchanter, les pilotes limitant le débit en FP64 à une valeur inférieure sur cette Radeon VII.

 

ALU Vega 20 [cliquer pour agrandir]Détails des unités de calcul de Vega 20

 

Finissons avec quelques ajouts complémentaires. Le premier est la prise en charge du PCIe 4.0 au sein de la puce, toutefois, AMD limite cette Radeon VII à la norme 3.0. Compte-tenu de l'absence de plateforme grand public compatible, cette décision est à nouveau on ne peut plus logique. Ensuite, le concepteur explique avoir amélioré certaines latences et quelques points limitant précédemment la montée en fréquence. Il profite probablement pour cela, des performances en hausse des transistors, nous y reviendrons un peu plus bas. Enfin, les rouges communiquent sur la présence de 64 points de mesure de la température (sans compter ceux liés à la HBM 2) du die, soit deux fois plus que sur Vega 10. De ce fait, AMD dispose d'un réseau de mesure très précis, lui permettant d'affiner au plus près la température maximale admissible et réguler en conséquence plus finement la ventilation. Cette température maximale mesurée au sein des 64 points est appelée Temperature Junction, elle devrait correspondre au Hot Spot qui était reporté par GPU-Z sur les précédentes Vega. La valeur température GPU correspond quant à elle généralement à celle mesurée sur les bords (Edge) selon AMD. 

 

Sensors T. Junction [cliquer pour agrandir]Localisation des sondes de température sur le die

 

• TSMC 7 nm

Mais la grosse nouveauté de Vega 20 n'est pas à chercher du côté de l'architecture ou des fonctionnalités, mais bien du process de fabrication retenu. C'est en effet le premier GPU dédié aux cartes graphiques, à être gravé en 7 nm par l'entremise de TSMC. Ce Node était pour le moment réservé aux puces dévolues à la mobilité, AMD a choisi une adoption plutôt précoce pour une puce haut de gamme, alors qu'il se contente par exemple du 12 nm pour le Polaris 30 de la RX 590 qui a été commercialisée 3 mois plus tôt, et que son concurrent fait de même pour Turing.

 

Cela constitue donc une prise de risques, mais cette dernière lui donne un avantage conséquent en termes de performance des transistors et densité, pour peu que la production suive. C'est probablement pour cela que les rouges se limitent pour le moment au haut de gamme, nécessitant des volumes de production bien moindre (malgré cela, il subsiste des doutes sur le niveau réel de disponibilité). Le gain en densité a permis de faire tenir sur un interposer de taille similaire, le GPU et 4 piles HBM 2, alors qu'il fallait se contenter de 2 avec le précédent GPU 14 nm !

 

Ce n'est pas anodin, la fabrication d'interposers de grandes tailles nécessite une production par multi-exposition bien plus coûteuse et donc difficile à rentabiliser, surtout dans le cadre d'une carte grand public. Les puces HBM 2 produites en masse étant à minima d'une capacité de 4 Go, Vega 20 ne peut donc embarquer moins de 16 Go, tout du moins pour converser la bande passante mémoire de 1 To/s permise par une telle configuration à 4 piles. 

 

7 nm TSMC [cliquer pour agrandir]

  L'effet de la densité accrue du 7 nm sur la taille du die

 

Puisque l'on parle densité, quid du résultat obtenu ? En s'appuyant sur les chiffres communiqués par AMD, le passage à ce nouveau Node permet d'améliorer la densité de 58%, de quoi réduire drastiquement la taille des dies, ou utiliser cette densité pour complexifier davantage les GPU. A noter qu'AMD communiquait précédemment sur une taille de 486 mm² concernant le die de Vega 10, ce dernier passe à présent à 495 mm². Par quelle magie ? En fait, les rouges communiquent à présent deux valeurs distinctes pour les die des Vega56 (486 mm²) et Vega64 (495 mm²), ce qui n'a pas de sens puisque la surface à graver reste identique, que l'on se serve ou non des "parties inactives". Il s'agissait probablement de communiquer précédemment sur une valeur inférieure, afin de rassurer les investisseurs quant aux coûts de production de Vega 10... Toujours est-il qu'en anticipant l'adoption de ce Node 7 nm, AMD prend au niveau de la densité en transistors, un avantage considérable sur son concurrent.

 

Cartes
GPU
Nombre de transistorsSuperficie Die

Densité (Millions de transistors / mm²)

Procédé de fabrication
Radeon VII Vega 20 13,2 Milliards 331 mm² 39,9 TSMC 7 nm FF
Radeon RX Vega56/64 Vega 10 12,5 Milliards 495 mm² 25,3 GF 14 nm LPP
GeForce RTX 2080 Ti TU102 18,6 Milliards 754 mm² 24,7 TSMC 12 nm FFN
GeForce RTX 2080 TU104 13,6 Milliards 545 mm² 24,9 TSMC 12 nm FFN
GeForce RTX 2070/60 TU106 10,8 Milliards 445 mm² 24,3 TSMC 12 nm FFN
GeForce GTX 1080 Ti GP102 12 Milliards 471 mm² 25,5 TSMC 16 nm FF+
GeForce GTX 1080/70 (Ti) GP104 7,2 Milliards 314 mm² 22,9 TSMC 16 nm FF+

 

L'avantage ne s'arrête pas là, puisque les performances desdits transistors progressent également significativement. Ainsi, AMD indique concernant ce process 7 nm, qui sera également utilisé pour ses futurs Ryzen 3000, qu'il est possible d'augmenter les performances de 25% pour la même consommation ou choisir de réduire cette dernière de 50% à ISO fréquence. Quelles conséquences pratiques pour Vega 20 ? Là où la RX Vega64 dispose d'un boost typique annoncé à 1547 MHz, la valeur attendue pour la Radeon VII est de 1750 MHz, soit +13%.

 

Mais qui dit adoption précoce, dit bien souvent coûts de production élevés du fait du prix facturé par le fondeur pour son process le plus évolué, mais aussi des Yields (taux de puces fonctionnelles par Wafer) peu reluisants au départ. C'est pourquoi AMD a été contraint d'améliorer le nombre de puces utilisables sur son nouveau haut de gamme, en désactivant certaines unités afin de permettre un recyclage de celles partiellement défectueuses. NVIDIA ne pratique pas autrement pour sa dernière gamme. Voici en conséquence les compromis que les rouges ont dû se résoudre à appliquer.

 

RADEON VIIQuantité activéeQuantité Présente
"Shader Engine" 4 4
CU 60 64
ALU 3840 4096
TMU 240 256
ROP 64 64
L2 (Mo) 4 4
Bus mémoire (bits) 4096 4096

 

Pas de quoi fouetter un canard chat, puisque seuls 6% des unités de calcul et texturing se voient désactivées. Ce choix doit probablement permettre à AMD de commercialiser sans perte sa nouvelle carte via ce recyclage, tout en tirant pratiquement le maximum du potentiel de sa puce (la bande passante n'étant pas impactée, l'écart moyen mesuré en jeu sera inférieur à 6%). Voilà pour Vega 20, passons page suivante à la description de la RADEON VII.




Les 174 Ragots
   
Les ragots sont actuellement
zone limitée - permis de ragotage requisouverts aux ragoteurs logués