Test • NVIDIA GeFORCE RTX 2060 & 2070 SUPER

RTX 4070 : 19 refs en stock Tendance baissière
RTX 4070 ti : 54 refs en stock Tendance haussière
RTX 3080 : 31 refs en stock Tendance haussière
RTX 4080 : 58 refs en stock Tendance baissière
RTX 4090 : 28 refs en stock Tendance haussière
RX 6800 : 8 refs en stock Tendance haussière
RX 6800 XT : 4 refs en stock Tendance baissière
RX 7900 XT : 12 refs en stock Tendance baissière
Core i5-13600K : 9 refs en stock Tendance haussière
Core i7-13700K : 6 refs en stock Tendance baissière
Core i9-13900K : 7 refs en stock Tendance baissière
Tendance stable
Ryzen 7 5800X : 4 refs en stock Tendance haussière
Ryzen 7 5800X3D : 2 refs en stock Tendance stable
Ryzen 7 7700X : 3 refs en stock Tendance stable
Ryzen 9 7800X3D : 3 refs en stock Tendance haussière
Ryzen 9 7900X : 2 refs en stock Tendance haussière
Ryzen 9 7900X3D : 2 refs en stock Tendance stable
Ryzen 9 7950X3D : 3 refs en stock Tendance baissière

La réception • Tests & articles • Cartes graphiques

• Turing

Pour ceux intéressés par l'architecture Turing, nous vous invitons à lire ou relire le dossier que nous lui avons consacré il y a quelque temps. Résumée en quelques lignes, cette dernière ressemble beaucoup à Volta avec quelques ajouts. Par rapport à Pascal (gaming) : des caches plus gros et plus rapides, des SM "plus petits" mais plus nombreux et capables de traiter en parallèle les calculs sur entiers ou en virgule flottante (y compris en demi-précision (FP16) à double vitesse).

Exécution concomitante flottants et entiers [cliquer pour agrandir]

Voilà pour la partie "classique" de l'architecture, NVIDIA a complété cette dernière par des Tensor Cores, accélérant significativement les calculs liés à l'intelligence artificielle, en particulier l'inférence, ainsi que les RT Cores, dédiés à l'accélération matérielle (des calculs d'intersection rayons / triangles) du Ray Tracing, utilisable en temps réel dans les jeux via un rendu hybride, mixant cette technique à une base rastérisation.

Turing en chiffres [cliquer pour agrandir]

Turing en chiffres dans sa déclinaison dédiée à la RTX 2080 Ti

Mais ces nouvelles fonctionnalités sont loin d'être gratuites en termes de "coût transistors", avec pour conséquence des dies pour le moins imposants du fait de la stagnation du procédé de gravure utilisé, et donc onéreux à produire, vu la réduction du nombre de GPU par Wafer (disques en silicium sur lesquels sont gravés les puces).

• TU104 & TU106

NVIDIA a conçu à partir de sa dernière architecture, cinq GPU, dont 2 privés des fonctionnalités d'accélération RT et IA, qui se retrouvent au sein des GTX 16xx, le préfixe rappelant l'absence des nouvelles fonctionnalités. Vous retrouverez ci-dessous un résumé des différents GPU utilisés sur les GeForce série 10, 16 et 20, nous avons abrégé la série SUPER avec un S .

Cartes	GPU	Nombre de transistors	Superficie Die	Densité (Millions de transistors / mm²)
GeForce RTX 2080 Ti	TU102	18,6 Milliards	754 mm²	24,7
GeForce RTX 2070S/80/80S	TU104	13,6 Milliards	545 mm²	24,9
GeForce RTX 2070/60/60S	TU106	10,8 Milliards	445 mm²	24,3
GeForce GTX 1660 (Ti)	TU116	6,6 Milliards	286 mm²	23,1
GeForce GTX 1650	TU117	4,7 Milliards	200 mm²	23,5
GeForce GTX 1080 Ti	GP102	12 Milliards	471 mm²	25,5
GeForce GTX 1080/70 (Ti)	GP104	7,2 Milliards	314 mm²	22,9
GeForce GTX 1060	GP106	4,4 Milliards	200 mm²	22
GeForce GTX 1050 (Ti)	GP107	3,3 Milliards	132 mm²	25

Quid de la RTX 2060 SUPER plus précisément ? Le modèle d'origine s'appuyait sur un TU106 dont 2 contrôleurs mémoire 32-bit avaient été désactivés (entraînant la désactivation d'un Mo de cache L2 et 16 ROP) ainsi que 6 SM. Ci-dessous, vous retrouverez une représentation schématique du TU106 "version" RTX 2060 SUPER :

TU106 configuration RTX 2060 SUPER [cliquer pour agrandir]

Elle hérite cette fois d'un GPU ne souffrant que de la désactivation de 2 SM, le bus mémoire étant de son côté intégral (256-bit). De quoi proposer une carte très proche de la RTX 2070 originelle, cette dernière ne conservant que 2 SM supplémentaires. Voici résumées les principales caractéristiques de son GPU dans le tableau ci-dessous et les désactivations opérées.

GeForce GTX 2060 SUPER	Quantité activée	Quantité Présente
GPC	3	3
TPC / SM	17 / 34	18 / 36
CUDA Cores	2176	2304
TMU	136	144
Tensor Cores	272	288
RT Cores	34	36
ROP	64	64
L2 (Mo)	4	4
Bus mémoire (bits)	256	256

A présent, attardons-nous sur sa grande sœur, la RTX 2070 SUPER. La version lancée fin 2018 utilisait un TU106 intégral, il n'était donc pas possible de faire beaucoup mieux à process inchangé (une version disposant de fréquences plus élevées aurait du mal à justifier un tel suffixe). Qu'à cela ne tienne, NVIDIA utilise à présent un TU104 que l'on retrouvait uniquement sur la RTX 2080, mais dans une configuration moins performante toutefois. On obtient donc une série 70 plus "traditionnelle", partageant son GPU avec la série 80, cela lui ouvre d'ailleurs la porte du multiGPU. Quid des détails ?

TU104 configuration RTX 2070 SUPER [cliquer pour agrandir]

En fait, ce sont pas moins de 8 SM (4 TPC) qui sont désactivés. Cette quantité correspond à un GPC, tel que nous l'avons représenté schématiquement en modifiant le diagramme de TU104. NVIDIA précise toutefois que cette configuration ne sera pas forcément celle retenue, selon les parties défectueuses au sein du die, les 6 GPC peuvent ainsi être conservés avec plus ou moins de SM actifs en leur sein. Si un GPC est toutefois désactivé, cela entraînera la perte d'un moteur de rastérisation, toutefois, l'impact au niveau des performances devrait être très mesuré (comme nous l'avions constaté sur les GTX 780 pouvant disposer elles-aussi d'un nombre variable de GPC actifs). Résumées ci-dessous, les caractéristiques principales de cette RTX 2070 SUPER.

GEFORCE RTX 2070 SUPER	QUANTITÉ ACTIVÉE	QUANTITÉ PRÉSENTE
GPC	5 ou 6	6
TPC / SM	20 / 40	24 / 48
CUDA Cores	2560	3072
TMU	160	192
Tensor Cores	320	384
RT Cores	40	48
ROP	64	64
L2 (Mo)	4	4
Bus mémoire (bits)	256	256

A noter que la RTX 2080 n'utilisant pas un TU104 complet (2 SM désactivés), il est plus que probable que la version SUPER qui sera détaillée ultérieurement, le fasse cette fois. Couplé à des fréquences plus élevées du GPU et de la mémoire (NVIDIA annonce 15 Gbps), ainsi qu'une enveloppe thermique en hausse pour laisser tout cela s'exprimer, on peut imaginer un gain d'une dizaine de pourcents par rapport à la première édition (ou "non SUPER" si vous préférez).

• GPU Boost

Ce mécanisme a pour objectif de pousser chaque puce au plus près de ses limites, en s'affranchissant de tests trop sélectifs en sortie de production. C'est en effet GPU Boost qui est chargé par la suite, de s'assurer que les conditions environnementales permettent au GPU de fonctionner de manière stable et sans risque. Pour ce faire, il impose un double carcan constitué d'une limite de consommation et de température selon l'itération. Avec la version 3 introduite lors du lancement de Pascal, à partir de 37°C et tous les 5°C supplémentaires, le GPU perd 1 bin (~13 MHz) et ce jusqu'à la consigne de température maximale. Il perd alors autant de bins que nécessaire pour rester sous celle-ci.

La fréquence progressant de concert avec la tension d'alimentation du GPU, c'est un moyen très efficace pour contrôler la consommation (qui évolue au carré de la tension et dispose aussi de sa propre limite), évitant ainsi une envolée des nuisances sonores, avec un refroidisseur pas forcément dimensionné pour la dissiper discrètement à fréquence maximale durant une charge soutenue, ce qui est le cas des Founders Edition à turbine. Le souci d'une telle approche, est la pénalisation de toutes les cartes Pascal, y compris les customs des constructeurs tiers, avec des refroidisseurs surdimensionnés. En effet, NVIDIA autorise la modification du TDP max. des cartes, mais en aucun cas des paliers de température par défaut de GPU Boost 3.0. Ci-dessous une représentation graphique de ce fonctionnement.

GPU Boost 3.0 [cliquer pour agrandir]

Avec Turing version RTX, NVIDIA a annoncé GPU Boost 4.0. En gros, ce dernier fonctionnerait de manière similaire, mais avec un ajustement qui fait toute la différence. En effet, les valeurs de températures sont à présent exposées, il est donc possible de les modifier. Bien sûr, il est nécessaire de rester dans la plage autorisée par le caméléon, mais le seuil à 37°C qui marquait le "début de la baisse" des fréquences, n'est plus imposé. Cela coïncide avec l’utilisation d'un refroidisseur plus performant sur les Founders Edition, qui ne perdent donc plus de fréquence du fait de la température. Toujours est-il, qu'il était très difficile de s'approcher du TDP max sur ces dernières en version Pascal, à part lors des premiers instants de forte sollicitation. Ce ne sera plus le cas avec les versions Turing RTX, qui seront davantage limitées par leur enveloppe thermique. Ci-dessous, la représentation schématique de GPU Boost 4.0. Notons également qu'un bin, prend à présent la valeur de 15 MHz, contre 13 MHz auparavant.

GPU Boost 4.0 [cliquer pour agrandir]

Nous avons précisé RTX car il semble bien que la série 16 ne soit pas gouvernée par la dernière itération de GPU Boost, mais bien la précédente ou plutôt un mix des deux, plus de détails à ce sujet dans nos dossiers dédiés à la série 16 de NVIDIA. Voilà pour les rappels, passons page suivante à la description des cartes de test que nous avons reçues.

Un poil avant ?

Soldes • Sapphire RX 590 Nitro+ à 187,91 €

Un peu plus tard ...

Et encore des projets AMEL en cours d'étude pour la fibre

sommaire

Sur le comptoir, au ~même sujet

	Test • AMD Radeon RX 6800 & RX 6800 XT
	Test • Intel Core i9-12900K/12900F / i7-12700K / i5-12600K/12600/12400F & Z690/B660
	Test • GeForce GTX 970 & 980
	Recap • Choisir sa carte mère Z97/H97
	Récap • Choisir sa mobale Z170
	Hard du hard • Configurer Windows 10
	Test • Intel Core i9-13900K, Core i7-13700K, Core i5-13600K & Z790
	Hard du hard • Connecteurs vidéo & définitions
	Récap • Les GTX 980Ti
	Test • NVIDIA GeFORCE RTX 3080
	Récap • Les GTX 950
	Test • AMD Ryzen 9 7950X, 7900X, Ryzen 7 7700X & Ryzen 5 7600X : Zen 4, AM5, X670E, B650E & DDR5