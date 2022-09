On commence à avoir, petit à petit, les spécifications des 3 GPU qui vont animer la RTX 4090 et les 2 RTX 4080. La question de la seconde RTX 4080 12 Go se pose, quel est l'intérêt de son existence ? Il y en a un commercial certainement, mais il n'est pas évident hormis peut-être la légitimité du prix de vente sous un nom de série 80. Bref, nous attendrons les tests, mais voilà les infos, recensées dans un zouli tableau, où nous avons rajouté le gros méchant Ampere GA102. Ouille !

skoi ? AD102 AD103 AD104 GA102 GPU AD102 AD103 AD104 GA102 Archi/Gravure Ada Lovelace / 5nm Ada Lovelace / 5nm Ada Lovelace / 5nm Ampere / 8nm Transistors 76.3 milliards 45.9 milliards 35.8 milliards 28.3 milliards Taille Die 608 mm² 378.6 mm² 294.5 mm² 628 mm² Densité Transistors 125.5 M/mm² 121.1 M/mm² 121 M/mm² 45.1 M/mm² Cuda Cores/SM 18432 / 144 10240 / 80 7680 / 60 10752 / 84 Tensor Cores 576 (4e Gen) 320 (4e Gen) 240 (4e Gen) 336 (3e Gen) RT cores 144 (3e Gen) 80 (3e Gen) 60 (3e Gen) 84 (2e Gen) ROP 192 112 80 112 Cache L2 96 Mo 64 Mo 48 Mo 6 Mo Carte Graph RTX 4090 RTX 4080 16 Go RTX 4080 12 Go RTX 3090 Ti

Premièrement, on devrait avoir des performances moindres avec la petite RTX 4080 que la grosse, ce qui va bien au-delà du bus mémoire et de la quantité de RAM. L'AD104 est bien moins fourni que l'AD103. On voit bien les efforts d'optimisation sur la densité en transistors, en moyenne 3 fois plus sur Lovelace qu'Ampere, en sachant qu'il y a un gros cache L2 qui n'existe pas sur Ampere. Et si on compare directement les GPU tête de gondole Lovelace et Ampere, à superficie identique, on peut dire qu'on en met plus sur le premier cité. Par ailleurs, la RTX 4080 12 Go se paye le luxe d'avoir un GPU plus richement fourni en transistors que le GA102, les performances devraient être du niveau ou un peu supérieures à la RTX 3090 Ti, mais cette spéculation sera validée, ou pas, par les tests quand les cartes seront lancées en novembre. Pour expliquer, cette dénomination N4 que Jensen a déclaré être mise au point entre TSMC et NVIDIA, est en fait du 5 nm optimisé, pas du 4 nm. Les tests !