• Spécifications

Commençons ce nouveau dossier par un récapitulatif d'un certain nombre de cartes haut de gamme des générations actuelles et passées. Celles qui nous intéressent aujourd'hui s'appuient sur 3 GPU : les GP102 / GP104 pour NVIDIA et Vega 10 du côté d'AMD.

 

CartesGPUFréquence Boost GPU (MHz)Fréquence Mémoire (MHz)Unités de calculTMUROPTaille mémoire (Go)Bus mémoire (bits)Calcul SP (Gflops)Bande Passante (Go/s)
HD 7970 GHz Tahiti 1050 1500 2048 128 32 3 384 4301 288
R9 290X Hawaii 1000 1250 2816 176 64 4 512 5632 320
R9 390 Hawaii 1000 1500 2560 160 64 8 512 5120 384
R9 390X Hawaii 1050 1500 2816 176 64 8 512 5914 384
R9 Fury Fiji 1000 500 3584 224 64 4 4096 7168 512
R9 Fury X Fiji 1050 500 4096 256 64 4 4096 8602 512
RX VEGA56 Vega 10 1471 800 3584 224 64 8 2048 10544 410
RX VEGA64 Vega 10 1546 945 4096 256 64 8 2048 12665 484
GTX 680 GK104 1058 1502 1536 128 32 2 256 3250 192
GTX 780 GK110 902 1502 2304 192 48 3 384 4156 288
GTX 780 Ti GK110 928 1750 2880 240 48 3 384 5345 336
GTX 970 GM204 1176 1753 1664 104 56 4

224

3920 196
GTX 980 GM204 1216 1753 2048 128 64 4 256 4981 224
GTX 980 Ti GM200 1075 1753 2816 176 96 6 384 6054 337
GTX TITAN X GM200 1075 1753 3072 192 96 12 384 6605 337
GTX 1070 GP104 1683 2003 1920 120 64 8 256 6463 256
GTX 1070 Ti GP104 1683 2003 2432 152 64 8 256 8186 256
GTX 1080 GP104 1733 1251 2560 160 64 8 256 8873 320
GTX 1080 Ti GP102 1582 1376 3584 224 88 11 352 11340 484
TITAN X GP102 1531 1251 3584 224 96 12 384 10974 480
TITAN Xp GP102 1582 1426 3840 240 96 12 384

12150

548
TITAN V GV100 1455 850 5120 320 96 12 3072 14899 653

 

Chez les verts, les GTX 1070, 1070 Ti et 1080 utilisent un GP104, une puce de taille moyenne (314 mm²) gravée en 16 nm FinFET par TSMC. Elle s'appuie sur 4 GPC (Graphics Processor Cluster), de grosses structures multifonctions reliées à 16 ROP (Render Output Unit), soit 64 en tout. Celles-ci sont interconnectés par groupe de 8, à un contrôleur mémoire 32-bit (bus 256-bit au total) et une portion (256 Ko) du cache L2 centralisé (2 Mo). Chaque GPC comprend en sus du moteur de rastérisation, 5 TPC (Texture Processor Cluster), eux-mêmes constitués d'un Polymorph Engine (unités géométriques) et d'un SM (Streaming Multiprocessor).

 

Ce dernier, base des architectures récentes du caméléon, est principalement constitué de 128 unités de calcul (32-bit) et 8 TMU (Texture Mapping Unit), portant leur nombre total au sein du GPU à 2560/160. NVIDIA associe au GP104 de la GDDR5 ou GDDR5X (GTX 1080). Cette dernière est également la seule à disposer d'une puce pleinement fonctionnelle (20 TPC/SM), les 2 autres voyant la désactivation d'un (1070 Ti) ou plusieurs (1070) SM. Enfin, les fréquences officielles sont particulièrement élevées par défaut et souvent amplement dépassées en pratique (gestion via GPU Boost 3.0).

 

Les GTX 1080 Ti et Titan X (2016) / Xp utilisent de leur côté une puce GP102 plus imposante à 471 mm², et toujours gravée par TSMC en 16 nm FinFET. Les différents éléments constitutifs du GPU progressent pour la plupart de 50% par rapport au GP104, avec 6 GPC, 30 TPC/SM, 3 Mo de L2, 3840 unités de calcul, 240 TMU et 96 ROP pour une puce intégrale. Le bus mémoire suit bien-sûr la même inflation à 384-bit sur les Titan, un contrôleur 32-bit étant toutefois désactivé sur la 1080 Ti (352-bit). Les 3 cartes utilisent par contre systématiquement de la GDDR5X, mais à des fréquences officielles différentes.

    

De leur côté, les 2 cartes d'AMD s'appuient sur le seul et unique Vega 10, gravé par Global Foundries via son process 14 nm, FinFET lui-aussi, pour une superficie légèrement supérieure au GP102, à 486 mm². Utilisation de mémoire HBM 2 oblige, il est raccordé via un interposer (au sein du même packaging), à 2 piles (stack) de 4 Go interfacées (chacune) en 1024-bit, créant ainsi un bus mémoire d'une largeur de 2048-bit. Le GPU s'appuie comme ses devanciers sur 4 pipelines graphiques, avec en tête de ce dernier, une grosse unité géométrique suivie du moteur de rastérisation (DSBR) de dernière génération, prenant en charge (à l'instar du concurrent) le Tile Rendering. Ensuite, la partie calcul est assurée par un total de 64 (New) Compute Unit (CU), comprenant chacune 4 TMU et 64 unités de calcul 32-bit, compatibles avec la 1/2 précision (16-bit) à double vitesse. Enfin, 64 ROP sont chargées d'écrire en mémoire par via un cache L2 centralisé de 4 Mo.

 

Voici résumées très succinctement, les différentes caractéristiques de nos protagonistes du jour. Si l'on s'attache aux chiffres, on peut penser sur le papier que les RX Vega sont équipées pour lutter avec les cartes s'appuyant sur GP102. C'est partiellement exact, tout du moins concernant les valeur brutes de bande passante mémoire, texturing et puissance de calcul. Mais comme toujours, les comparaisons à ce niveau sont à prendre avec beaucoup de précautions du fait d'une différence importante de conception architecturale (les GeFORCE disposent par exemple d'unités SFU chargées des opérations complexes, alors que ce sont les unités de calcul classiques qui s'en occupent sur les RADEON) et donc d'efficience, modulant donc largement ces données brutes.

 

Qui plus est, les fréquences réellement appliquées sont déterminantes, et l'avantage à ce niveau est plutôt du côté vert, tout comme l'est le fillrate et le traitement de la géométrie. Les performances ludiques d'un GPU sont le fruit d'un savant équilibre entre ses composantes et le besoin des moteurs 3D, c'est pourquoi on peut disposer de gros chiffres sur le papier, mais pas forcément les traduire en pratique par des résultats probants en jeu. C'est le cas de Vega 10, AMD a donc tenté de positionner financièrement les cartes gaming utilisant ce dernier en face des cartes GP104, affichant un niveau de performance ludique similaire, plutôt que celles à base de GP102. Ce n'est bien entendu pas si facile, puisque l'on peut sans risque estimer (vu la taille de la puce et l'utilisation d'HBM impliquant un interposer) que le coût de production de Vega 10 est bien plus adapté au segment du GP102 qu'à celui de son petit frère...  

 

 

• Tests synthétiques

Nous utilisons la suite de tests Geeks 3D et débutons avec PixMark Julia FP32, qui permet de mesurer le débit de pixels en simple précision. Dans ce test relativement bref et qui permet donc aux modèles de référence de conserver des fréquences élevées. On constate sans peine que le Flagship des rouges, s'il arrive à prendre un très léger ascendant sur la GTX 1080 Founders Edition, reste dans les "mêmes eaux" que cette dernière et ne peut donc absolument pas lutter à ce niveau, avec les cartes s'appuyant sur  GP102. L'explication est à chercher du côté des 96 unités de rendu (ROP) de ce dernier, contre 64 aux Vega. 

 

 

Poursuivons avec le test GiMark, qui mesure les performances de nos cartes sur une scène très chargée au niveau de la géométrie. A nouveau Vega 10 et GP104 jouent des coudes, alors que GP102 est intouchable. Point intéressant, la TITAN Xp devance cette fois très nettement la GTX 1080 Ti, pourtant l'écart de caractéristiques n'explique pas un tel delta. L'explication est à chercher du côté des pilotes : le caméléon bride les performances absolues de sa gamme grand public dans le domaine géométrique, pour privilégier ses Quadro et éviter une concurrence interne sur le marché pro. Toutefois, depuis le lancement de la VEGA Frontier Edition qui chasse sur les mêmes terres, le caméléon a réactivé dans ses pilotes pour TITAN certaines optimisations et fait disparaître quelques restrictions.    

 

 

Terminons cette séquence tests synthétiques, par le traitement de la Tesselation. Cette fois, Vega 10 peine à accrocher GP104 castré. Les multiples unités géométriques traitant (entre autres choses) la Tesselation étant incluses au sein des TPC (structure interne incluant les SM) sur les GeFORCE récentes, leur multiplication évite l'engorgement qui peut survenir avec de grosses unités centralisées et moins nombreuses (telles celles de Vega 10), lorsque les facteurs de Tesselation sont élevés comme ici (64x). L'écart entre 1080 Ti et Titan Xp s'explique de la même façon que pour le test précédent.

 

 

C'est tout pour cette partie, voyons page suivante le protocole de test.




Plus d'infos avec le comptoir de l'info


Les 26 Ragots
   
Les ragots sont actuellement
zone limitée - permis de ragotage requisouverts aux ragoteurs logués