Test • AMD RADEON VII

RTX 4070 : 26 refs en stock Tendance haussière
RTX 4070 ti : 67 refs en stock Tendance haussière
RTX 3080 : 36 refs en stock Tendance haussière
RTX 4080 : 65 refs en stock Tendance baissière
RTX 4090 : 47 refs en stock Tendance haussière
RX 6800 : 8 refs en stock Tendance stable
RX 6800 XT : 5 refs en stock Tendance haussière
RX 7900 XT : 11 refs en stock Tendance baissière
Core i5-13600K : 7 refs en stock Tendance baissière
Core i7-13700K : 5 refs en stock Tendance baissière
Core i9-13900K : 5 refs en stock Tendance haussière
Tendance stable
Ryzen 7 5800X : 3 refs en stock Tendance baissière
Ryzen 7 5800X3D : 1 ref en stock Tendance stable
Ryzen 7 7700X : 2 refs en stock Tendance baissière
Ryzen 9 7800X3D : 2 refs en stock Tendance haussière
Ryzen 9 7900X : 1 ref en stock Tendance stable
Ryzen 9 7900X3D : 1 ref en stock Tendance stable
Ryzen 9 7950X3D : 2 refs en stock Tendance haussière

La réception • Tests & articles • Cartes graphiques

• VEGA 20

Pour ceux intéressés par l'architecture Vega, nous vous invitons à lire ou relire la page que nous lui avions consacrée lors du dossier dédié à la RX Vega⁶⁴. Résumée en quelques lignes, cette dernière s'appuie toujours sur GCN (Graphics Core Next) intronisé avec les Radeon HD 7900, même si AMD a fait disparaître toute référence à cette dénomination pour l'architecture. On peut toutefois considérer Vega comme étant la 5^ème itération de GCN, avec des évolutions au niveau des unités de calculs supportant à présent la 1/2 précision (FP16) à double vitesse.

Rendu die Vega 20 [cliquer pour agrandir]

Les unités de rastérisation progressent également en adoptant le DSBR (Draw Stream Bining Rasterizer), pouvant générer des gains opportunistes via Tiled Rendering. Le cache L2 centralisé est également doublé, et diverses optimisations sont apportées pour la géométrie (Primitive Shader) ou l'IA (instructions spécifiques au Deep Learning). Enfin, un grand nombre de transistors a été dédié pour permettre de monter davantage en fréquence (redondance du signal, contrôle et correction d'erreurs, etc.). Voilà pour l'architecture, en tout cas celle déclinée dans le seul GPU dédié disponible, alias Vega 10.

Il a été rejoint en fin d'année dernière par Vega 20, un GPU très proche mais qui diffère toutefois en quelques points. AMD ne nous ayant pas communiqué de diagramme de cette nouvelle puce, nous avons modifié celui fourni lors du lancement de la Vega⁶⁴. La principale nouveauté est l'utilisation de 4 piles HBM 2 au lieu de 2 sur la précédente déclinaison. Cette modification a un impact notable concernant la bande passante mémoire, puisque le bus passe de 2048-bit à 4096-bit ! Par contre, les unités de rendu (ROP) restent inchangées à 64, une valeur n'ayant plus évolué depuis Hawaii.

Diagramme Vega 20 (supputé) [cliquer pour agrandir]

Diagramme simulé de Vega 20

Toujours au niveau des différences séparant Vega 20 de son prédécesseur, les unités de calcul évoluent également. En effet, en sus des demi-précision (FP16 à double vitesse) et simple précision (FP32), elles sont à présent capables de réaliser la double précision (FP64) avec un ratio d'1/2 par rapport à la SP. Cette fonctionnalité n'a aucun intérêt d'un point de vue ludique, mais les professionnels pourront y trouver une utilité pour certaines tâches. Ceux y voyant une opportunité d'économie à ce niveau, par rapport à une coûteuse MI50/60 devront vite déchanter, les pilotes limitant le débit en FP64 à une valeur inférieure sur cette Radeon VII.

ALU Vega 20 [cliquer pour agrandir] Détails des unités de calcul de Vega 20

Finissons avec quelques ajouts complémentaires. Le premier est la prise en charge du PCIe 4.0 au sein de la puce, toutefois, AMD limite cette Radeon VII à la norme 3.0. Compte-tenu de l'absence de plateforme grand public compatible, cette décision est à nouveau on ne peut plus logique. Ensuite, le concepteur explique avoir amélioré certaines latences et quelques points limitant précédemment la montée en fréquence. Il profite probablement pour cela, des performances en hausse des transistors, nous y reviendrons un peu plus bas. Enfin, les rouges communiquent sur la présence de 64 points de mesure de la température (sans compter ceux liés à la HBM 2) du die, soit deux fois plus que sur Vega 10. De ce fait, AMD dispose d'un réseau de mesure très précis, lui permettant d'affiner au plus près la température maximale admissible et réguler en conséquence plus finement la ventilation. Cette température maximale mesurée au sein des 64 points est appelée Temperature Junction, elle devrait correspondre au Hot Spot qui était reporté par GPU-Z sur les précédentes Vega. La valeur température GPU correspond quant à elle généralement à celle mesurée sur les bords (Edge) selon AMD.

Sensors T. Junction [cliquer pour agrandir] Localisation des sondes de température sur le die

• TSMC 7 nm

Mais la grosse nouveauté de Vega 20 n'est pas à chercher du côté de l'architecture ou des fonctionnalités, mais bien du process de fabrication retenu. C'est en effet le premier GPU dédié aux cartes graphiques, à être gravé en 7 nm par l'entremise de TSMC. Ce Node était pour le moment réservé aux puces dévolues à la mobilité, AMD a choisi une adoption plutôt précoce pour une puce haut de gamme, alors qu'il se contente par exemple du 12 nm pour le Polaris 30 de la RX 590 qui a été commercialisée 3 mois plus tôt, et que son concurrent fait de même pour Turing.

Cela constitue donc une prise de risques, mais cette dernière lui donne un avantage conséquent en termes de performance des transistors et densité, pour peu que la production suive. C'est probablement pour cela que les rouges se limitent pour le moment au haut de gamme, nécessitant des volumes de production bien moindre (malgré cela, il subsiste des doutes sur le niveau réel de disponibilité). Le gain en densité a permis de faire tenir sur un interposer de taille similaire, le GPU et 4 piles HBM 2, alors qu'il fallait se contenter de 2 avec le précédent GPU 14 nm !

Ce n'est pas anodin, la fabrication d'interposers de grandes tailles nécessite une production par multi-exposition bien plus coûteuse et donc difficile à rentabiliser, surtout dans le cadre d'une carte grand public. Les puces HBM 2 produites en masse étant à minima d'une capacité de 4 Go, Vega 20 ne peut donc embarquer moins de 16 Go, tout du moins pour converser la bande passante mémoire de 1 To/s permise par une telle configuration à 4 piles.

7 nm TSMC [cliquer pour agrandir]

L'effet de la densité accrue du 7 nm sur la taille du die

Puisque l'on parle densité, quid du résultat obtenu ? En s'appuyant sur les chiffres communiqués par AMD, le passage à ce nouveau Node permet d'améliorer la densité de 58%, de quoi réduire drastiquement la taille des dies, ou utiliser cette densité pour complexifier davantage les GPU. A noter qu'AMD communiquait précédemment sur une taille de 486 mm² concernant le die de Vega 10, ce dernier passe à présent à 495 mm². Par quelle magie ? En fait, les rouges communiquent à présent deux valeurs distinctes pour les die des Vega⁵⁶(486 mm²) et Vega⁶⁴ (495 mm²), ce qui n'a pas de sens puisque la surface à graver reste identique, que l'on se serve ou non des "parties inactives". Il s'agissait probablement de communiquer précédemment sur une valeur inférieure, afin de rassurer les investisseurs quant aux coûts de production de Vega 10... Toujours est-il qu'en anticipant l'adoption de ce Node 7 nm, AMD prend au niveau de la densité en transistors, un avantage considérable sur son concurrent.

Cartes	GPU	Nombre de transistors	Superficie Die	Densité (Millions de transistors / mm²)	Procédé de fabrication
Radeon VII	Vega 20	13,2 Milliards	331 mm²	39,9	TSMC 7 nm FF
Radeon RX Vega^56/64	Vega 10	12,5 Milliards	495 mm²	25,3	GF 14 nm LPP
GeForce RTX 2080 Ti	TU102	18,6 Milliards	754 mm²	24,7	TSMC 12 nm FFN
GeForce RTX 2080	TU104	13,6 Milliards	545 mm²	24,9	TSMC 12 nm FFN
GeForce RTX 2070/60	TU106	10,8 Milliards	445 mm²	24,3	TSMC 12 nm FFN
GeForce GTX 1080 Ti	GP102	12 Milliards	471 mm²	25,5	TSMC 16 nm FF+
GeForce GTX 1080/70 (Ti)	GP104	7,2 Milliards	314 mm²	22,9	TSMC 16 nm FF+

L'avantage ne s'arrête pas là, puisque les performances desdits transistors progressent également significativement. Ainsi, AMD indique concernant ce process 7 nm, qui sera également utilisé pour ses futurs Ryzen 3000, qu'il est possible d'augmenter les performances de 25% pour la même consommation ou choisir de réduire cette dernière de 50% à ISO fréquence. Quelles conséquences pratiques pour Vega 20 ? Là où la RX Vega⁶⁴ dispose d'un boost typique annoncé à 1547 MHz, la valeur attendue pour la Radeon VII est de 1750 MHz, soit +13%.

Mais qui dit adoption précoce, dit bien souvent coûts de production élevés du fait du prix facturé par le fondeur pour son process le plus évolué, mais aussi des Yields (taux de puces fonctionnelles par Wafer) peu reluisants au départ. C'est pourquoi AMD a été contraint d'améliorer le nombre de puces utilisables sur son nouveau haut de gamme, en désactivant certaines unités afin de permettre un recyclage de celles partiellement défectueuses. NVIDIA ne pratique pas autrement pour sa dernière gamme. Voici en conséquence les compromis que les rouges ont dû se résoudre à appliquer.

RADEON VII	Quantité activée	Quantité Présente
"Shader Engine"	4	4
CU	60	64
ALU	3840	4096
TMU	240	256
ROP	64	64
L2 (Mo)	4	4
Bus mémoire (bits)	4096	4096

Pas de quoi fouetter un canard chat, puisque seuls 6% des unités de calcul et texturing se voient désactivées. Ce choix doit probablement permettre à AMD de commercialiser sans perte sa nouvelle carte via ce recyclage, tout en tirant pratiquement le maximum du potentiel de sa puce (la bande passante n'étant pas impactée, l'écart moyen mesuré en jeu sera inférieur à 6%). Voilà pour Vega 20, passons page suivante à la description de la RADEON VII.

Un poil avant ?

Le 7nm Intel, ça commencera en Oregon !

Un peu plus tard ...

TU116 déniché dans AIDA64

sommaire

Sur le comptoir, au ~même sujet

	Test • AMD Radeon RX 6800 & RX 6800 XT
	Test • Intel Core i9-12900K/12900F / i7-12700K / i5-12600K/12600/12400F & Z690/B660
	Test • GeForce GTX 970 & 980
	Recap • Choisir sa carte mère Z97/H97
	Récap • Choisir sa mobale Z170
	Hard du hard • Configurer Windows 10
	Test • Intel Core i9-13900K, Core i7-13700K, Core i5-13600K & Z790
	Hard du hard • Connecteurs vidéo & définitions
	Récap • Les GTX 980Ti
	Test • NVIDIA GeFORCE RTX 3080
	Récap • Les GTX 950
	Test • AMD Ryzen 9 7950X, 7900X, Ryzen 7 7700X & Ryzen 5 7600X : Zen 4, AM5, X670E, B650E & DDR5