• GP102

Avant de décrire la carte que nous a fait parvenir NVIDIA, passons en revue les principales caractéristiques de son GPU aka GP102. Ce dernier fait partie de ce que l'on pourrait appeler les "grosses puces" avec pas moins de 471 mm², même si on reste relativement éloigné des records à ce niveau, comme le GP100 et ses 610 mm². Mais revenons à la star du jour qui concentre pas moins de 12 milliards de transistors au sein de son die. C'est TSMC qui a été choisi pour graver la puce via son 16 nm déjà usité sur les GP100/104/106. La taille est donc en hausse de 50 % par rapport à GP104 et le nombre de transistors est encore plus impressionnant avec +66 % vis-à-vis de la même référence. C'est bien entendu l’architecture Pascal qui est à la manœuvre, pour les détails concernant cette dernière, nous vous invitons à lire ou relire la page qui lui est dédiée dans le dossier GTX 1070/1080. Commençons par le diagramme du GPU :

 

diagramme logique de GP102-350 [cliquer pour agrandir]

Diagramme logique du GP102-350

 

GP102 se compose de 6 GPC (Graphics Processing Cluster) qui comprennent en leur sein un Raster Engine chargé de transformer les triangles en pixels (16 par cycle) et 6 TPC (Texture Processing Cluster). Ces derniers sont constitués d'un Polymorph Engine dédié à la géométrie, ainsi qu'un SM (Streaming Multiprocessor) incluant 128 unités de calcul SP (également 4 DP n'apparaissant pas sur le schéma), 8 unités de texturing et du cache. La version 350 de GP102 implique la désactivation de 2 TPC, ce qui porte leur nombre à 28 en tout, à l'instar de la puce utilisée pour la TITAN X. Notons que schématiquement, les TPC sont désactivés dans des GPC différents, mais il n'est pas impossible qu'ils le soient au sein d'un même GPC, réduisant ainsi le débit de calcul à 12 pixels/cycle, soit moins que le Rasterizer.

 

Pour autant, ces deux GP102 ne sont pas tout à fait identiques : NVIDIA a décidé de retenir une configuration légèrement bridée au niveau de l'interface mémoire (augmentant probablement les Yields), en désactivant un contrôleur mémoire 32-bit (et les 8 ROP / 256 Ko L2 liés) sur les 12 constituant le bus mémoire à 384-bit d'un GP102 intégral. Il ne reste donc "que" 352-bit actifs et le caméléon a décidé de ne pas se lancer dans un bus tarabiscoté à la GTX 970 pour conserver une quantité de mémoire paire, mais a tout simplement supprimé une puce mémoire portant ainsi la capacité totale à 11 Go contre 12 à la TITAN X, une solution assurément plus "propre" et qui évitera toute polémique sur le sujet. Pour maintenir la bande passante, le caméléon a opté pour des puces plus rapides à 11 Gbps.

 

gddr5x

 

NVIDIA indique avoir particulièrement travaillé son contrôleur mémoire au sein des générations Maxwell/Pascal pour autoriser des fréquences très élevées, mais il a aussi collaboré étroitement avec les fabricants de mémoires sur la qualité du signal d'horloge, en particulier la zone critique de changement d'état ("l’œil" entre les courbes sinusoïdales), afin de limiter au maximum le bruit et la gigue nuisant aux fréquences très élevées, comme en témoigne la capture précédente. Pour rappel, des algorithmes de compression couleur (Delta Color) très évolués, permettent également de réduire la quantité de données à transférer, augmentant de fait le débit effectif. Enfin, le Tiled Caching permet lui aussi de limiter les accès mémoires en ne rasterisant que les triangles visibles, ceci via l'utilisation du cache L2 et d'une unité dédiée (binner).

 

tiledcaching

 

Du côté des fonctionnalités, on retrouve les mêmes éléments que pour GP104. Ainsi, au niveau de la prise en charge DX12, pas de nouveautés (niveau de fonctionnalités 12_1 / Tier 2) par rapport à Maxwell. Le moteur vidéo permet toujours 4 écrans simultanés et supporte les normes HDMI 2.0B et DP 1.3/1.4 pour le HDR entre autres choses. Côté décodage/encodage, on conserve les capacités du GP104. Poursuivons par le SMP (Simultaneous Multi-Projection), GPU Boost 3.0 et Fast Sync qui répondent toujours présents à l'instar des autres puces de cette génération. Enfin, un mot rapide sur les instructions DP2A et DP4A dédiées au Deep Learning et permettant d'accélérer par 2 et 4 les opérations à faible précision (16 et 8 bits). Voilà pour un bref tour d'horizon de ce GPU, passons aux caractéristiques de la seconde carte l'abritant, en comparaison d'autres références haut de gamme, présentes ou passées.

 

 

• Spécifications

 

CartesGPUFréquence GPU (MHz)Fréquence Mémoire (MHz)Unités de calculTMUROPTaille mémoire (Go)Bus mémoire (bits)Calcul SP (Gflops)Bande Passante (Go/s)
HD 7970 GHz Tahiti 1050 1500 2048 128 32 3 384 4301 288
HD 7990 Tahiti (x2) 950 à 1000 1500 2048 (x2) 128 (x2) 32 (x2) 3 (x2) 384 (x2) 7782 à 8192 576
R9 295 X2 Hawaii (x2) 1018 1250 2816 (x2) 176 (x2) 64 (x2) 4 (x2) 512 (x2) 11467 640
R9 390X Hawaii 1050 1500 2816 176 64 8 512 5914 384
R9 Fury X Fiji 1050 500 4096 256 64 4 4096 8602 512
RADEON PRO DUO Fiji (x2) 1000 500 4096 (x2) 256 (x2) 64 (x2) 4 (x2) 4096 (x2) 16384 1024
GTX 780 Ti GK 110 876 à 928 1750 2880 240 48 3 384 5045 à 5345 336
TITAN GK110 837 à 876 1502 2688 224 48 6 384 4500 à 4709 288
TITAN Black GK110 889 à 980 1750 2880 240 48 6 384 5121 à 5645 336
TITAN Z GK110 (x2) 705 à 876 1750 2880 (x2) 240 (x2) 48 (x2) 6 (x2) 384 (x2) 8122 à 10092 672
GTX 980 Ti GM200 1000 à 1075 1753 2816 176 96 6 384 5632 à 6054 337
TITAN X GM200 1000 à 1075 1753 3072 192 96 12 384 6144 à 6605 337
GTX 1080 GP104 1607 à 1733 1251 2560 160 64 8 256 8228 à 8873 320
GTX 1080 Ti GP102 1480 à 1582 1376 3584 224 88 11 352 10609 à 11340 484
TITAN X GP102 1417 à 1531 1251 3584 224 96 12 384 10157 à 10974 480

 

GeFORCE GTX 1080 Ti

 

La GTX 1080 Ti devance la TITAN X (2016) de 3,3 % au niveau de la puissance de calcul en se basant sur les boost respectifs annoncés. Toutefois, cette valeur est très fluctuante suivant la capacité de refroidissement et la consommation, nous vérifierons donc ce point page 16. Il en est de même pour le texturing, quant à la bande passante mémoire, elle est en hausse de 0,8 %, soit un écart négligeable. Côté Fillrate, selon la configuration des deux GP102, à savoir la désactivation des 2 TPC au sein du même GPC ou non, la TITAN X pourra prendre ou non, un léger avantage du fait de ses 96 ROP actifs contre 88 à la GTX 1080 Ti.

 

Si on s'attache uniquement aux chiffres bruts, la Fury X du concurrent agée de 20 mois n'est devancée "que" de 32 % en puissance de calcul et conserve un ascendant de 6,66 % pour la bande passante mémoire. Elle affiche par contre de lourds déficits en géométrie et fillrate, sans compter que n'apparaît pas dans les chiffres de calcul SP, l'apport des unités SFU des GeFORCE. Passons page suivante à la description de la carte.




Les 50 Ragots
   
Les ragots sont actuellement
prévention anti troll, loguez-vous !ouverts aux ragoteurs logués