• GA106

Si vous êtes intéressés par les détails de l'architecture Ampere, nous vous invitons naturellement à consulter la partie correspondante dans le dossier consacré à la RTX 3080. Comme nous l'indiquions en débutant cet article, la nouvelle venue utilise le GPU GA106, qui apparait donc pour la première fois. Ces puces xx6 sont généralement utilisées en version intégrale ou presque sur les cartes de la gamme xx60 (GM204 = 960, GP106 = 1060, TU106 = 2060 (version castrée mais bien moins sur le refresh SUPER)), celle-ci ne faisant donc pas exception. Pourtant, depuis le début des RTX 30, Nvidia a fait glisser sa gamme vers le GPU supérieur ou dans une configuration plus musclée (3080 utilisant un GA102 et non 104, 3060 Ti utilisant elle GA104 et non 106), du fait de la concurrence atteignant un niveau non attendu ou d'un procédé de gravure moins performant qu'espéré. Mais du coup, le caméléon ne pratique pas ce glissement pour la RTX 3060. Est-ce dû à une RX 6700 finalement moins ambitieuse ou simplement la certitude de vendre compte-tenu de la demande actuelle ? Il faudra attendre quelque peu pour connaitre la réponse, toujours est-il que pour revenir à la RTX 3060, voici résumé ci-dessous les principales caractéristiques de  son GPU.

 

GA106RTX 3060Complet
GPC 3 3
TPC / SM 14 / 28 15 / 30
FP32 3584 3840
TMU 112 120
Tensor Cores 112 120
RT Cores 28 30
ROP 48 48
L2 (Mo) 3 3
Bus mémoire (bits) 192 192

 

La RTX 3060 dispose d'un peu plus de 93% des unités présentes dans le die activées (un seul TPC soit 2 SM désactivés). Un chiffre du même ordre que celui retrouvé pour le GA102 de la RTX 3090 ou le GA104 de la RTX 3070 par exemple. Nous détaillerons les fréquences respectives un peu plus bas. Nvidia ne fournissant pas de diagramme pour cette carte, nous avons modifié celui d'un GA106 complet, pour faire apparaître les désactivations. Ainsi, un seul GPC se voit impacté en perdant 20% de ses unités, tandis que les deux autres sont complets, tout comme le sous-système mémoire. Si on s'attache à présent à la structure macro du GPU, ce dernier ressemble à un TU106 auquel on aurait amputé le bus mémoire d'un quart, mais avec les apports d'Ampere (doublement des unités FP32). Bref un GPU mieux doté côté puissance de calcul brute, mais limité par sa bande passante mémoire. Nous verrons à l'usage ce qu'il sen sera, mais on sent que les arbitrages opérés l'ont été dans le but de réduire les coûts via une puce plus petite, mais pas forcément beaucoup plus ambitieuse que sa devancière au niveau des performances en rastérisation.

 

A noter toutefois que le GPU sera systématiquement associé à 12 Go de mémoire sur les 3060, soit davantage que les RTX 3060 Ti, 3070 et même 3080. Pourquoi une telle quantité sur cette carte, alors que les modèles plus haut de gamme sont moins bien lotis à ce niveau ? Tout simplement parce que le caméléon n'avait pas d'autre choix du fait d'un bus mémoire 192-bit, imposant avec les puces disponibles, soit 6 Go soit 12 Go, sans bricoler un bus hybride façon GTX 970, que Nvidia souhaite probablement éviter de reproduire... Et si le choix retenu est finalement la seconde valeur, ce n'est pas par bonté d'âme des verts, mais tout simplement car 6 Go (à contrario de 8 ou 10 Go), commencent à être réellement limitants dans quelques jeux contemporains et les définitions visées par cette carte. Il eut été ainsi très mal avisé de proposer une carte déjà limitée par ce paramètre dans certains jeux, alors qu'elle commence tout juste sa commercialisation.

 

Diagramme GA106 [cliquer pour agrandir]GA106, dans sa version amputée pour la RTX 3060

 

Un dernier point sur le GPU, Nvidia a décidé de s'attaquer au problème du minage de l'Ethereum sur cette GTX 3060, via un mix de solution hardware et software. En pratique, dès que les pilotes détectent certains algorithmes, le débit de calcul est divisé par 2 pour rendre la solution moins pertinente pour cette tâche. Des tests rapides montrent que c'est effectivement bien fonctionnel, mais que d'autres cryptomonnaies peuvent toujours être miner à plein débit. Voilà pour les choix du caméléon concernant son nouveau GPU, rappelons à présent comment ce dernier se positionne dans les productions récentes de puces graphiques. Le passage au process 8 nm de Samsung a permis de gonfler la puissance en virgule flottante dans une enveloppe de puissance similaire, tout en réduisant significativement la taille du die, malgré l'inflation du nombre de transistors le constituant. Ce n'est bien sûr pas sans intérêt, puisque plus la surface est réduite, et plus il est possible de produire de GPU par Wafer (disques de silicium sur lesquels sont gravés les semi-conducteurs). 

 

Gravure
GPUNombre de transistorsSuperficie Die

Densité (Millions de transistors / mm²)

7 nm TSMC GA100 54.2 Milliards 826 mm² 65,6
7 nm TSMC Navi 21 26,8 Milliards 520 mm² 51.6
8 nm Samsung GA106 13,3 Milliards 276 mm² 48
8 nm Samsung GA102 28,3 Milliards 628 mm² 45
8 nm Samsung GA104 17,4 Milliards 392 mm² 44,4
7 nm TSMC Navi 10 10,3 Milliards 251 mm² 41
7 nm TSMC Vega 20 13.2 Milliards 331 mm² 39.9
16 nm TSMC GP102 12 Milliards 471 mm² 25,5
14 nm GF Vega 10 12.5 Milliards 495 mm² 25,3
16 nm TSMC GP100 15,3 Milliards 610 mm² 25.1
12 nm TSMC TU104 13,6 Milliards 545 mm² 25
12 nm TSMC TU102 18,6 Milliards 754 mm² 24,7
12 nm TSMC TU106 10,8 Milliards 445 mm² 24,3

 

GA106 embarquent ainsi 13,3 milliards de transistors au sein des 276 mm² de son die. Ce dernier ne fait donc que 62% de la taille de TU106, tout en augmentant de 23% le nombre de transistors intégrés. En conséquence, la densité progresse de 97,5 %. Au-delà de ce gain impressionnant, on notera que la densité atteinte est remarquable, puisque très proche de celle de Navi 21 utilisant pourtant un procédé d'une génération ultérieure, probablement du fait d'un effort particulier au niveau du design de la puce. A noter toutefois qu'en comparaison, GP106 ne faisait à son époque que 200 mm² en 16 nm, ou GM206 232 mm² en 28 nm. Sans en arriver à la taille extravagante de TU106 pour une puce de cette série, GA106 est donc plutôt un "gros" GPU pour sa gamme, du fait d'une inflation significative du nombre de transistors employés depuis 2 ans, et l'introduction des accélérations RT et IA.



Les 61 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !