• Rappels

Les cartes que nous allons tester ce jour réutilisent des GPU déjà usités l'an passé, c'est pourquoi nous nous contenterons de brefs rappels à ce niveau. La GTX 1050 n'est pas une nouvelle carte puisque commercialisée fin octobre dernier en même temps que le modèle Ti, l'absence de sample (et de disponibilité ensuite nous concernant) nous avait toutefois empêché de la tester jusqu'alors. Voilà pour une rapide mise en contexte, passons sans tarder au premier GPU de ce dossier.

 

• Baffin

Avant de décrire la RADEON RX 560 que nous nous sommes procurés, quelques petits rappels sur son GPU étrenné lors du lancement des RX 460 il y a un an. Ce dernier se "contente" de 123 mm² pour 3 milliards de transistors, soit un peu plus de la moité de son grand frère Ellesmere (232 mm² / 5,7 Mrds). Pour les détails de l'architecture, nous vous invitons à vous référer à la page qui lui est dédiée dans le dossier RX 480.

 

diagram t [cliquer pour agrandir]

Le diagramme logique de Baffin et son nouveau packaging réduit - Cliquer pour agrandir

 

Sa taille réduite permet d'abaisser significativement les coûts de production (plus de GPU par wafer). Pour ce faire, il n'emploie plus que deux Shader Engine (4 pour Ellesmere) impliquant un débit maximum de 2 triangles par cycle. Au sein de ceux-ci, le nombre de CU (Compute Unit, intégrant chacune 64 unités de calcul et 4 TMU pour le texturing) est légèrement réduit par rapport à son grand frère en passant de 9 à 8 pour un total de 16 dans un P11 intégral, soit 1024 unités de calcul et 64 TMU. Du côté interface mémoire et cache, là aussi en comparaison de P10, tout est divisé par deux avec 16 ROP, un cache L2 à 1 Mo et un bus 128-bit.

 

Il profite à l'instar de "l'autre" puce Polaris, de l'amélioration des algorithmes de compression couleur sans perte (Delta Color), ainsi que des contrôleurs mémoire révisés pour supporter des fréquences GDDR5 bien plus élevées (jusqu'à 2 GHz). Il est gravé en 14 nm par GlobalFoundries (procédé sous licence Samsung) et officiellement la RX 560 utilise un Polaris 21, contre P11 pour sa devancière. Gageons qu'il ne s'agit là que d'un artifice marketing pour générer de la nouveauté : les 2 puces doivent être identiques, mais le process de fabrication désormais plus mature permet des rendements supérieurs et des puces montant davantage en fréquence.

 

 

• GP107

Passons à présent en revue les principales caractéristiques du GP107 qui est le concurrent désigné de Polaris 11/21. Il est légèrement plus grand que ce dernier à 132 mm² pour 3,3 milliards de transistors, une taille (+7%) et densité tout de même très proches de celles de Baffin. Par rapport à GM107 (148 mm² / 1,87 Mrds), cela permet de produire une puce 17 % plus petite, mais disposant de 75 % de transistors supplémentaires. C'est bien entendu l’architecture Pascal qui est à la manœuvre ; pour les détails concernant cette dernière, nous vous invitons à vous référer à la page qui lui est dédiée dans le dossier GTX 1070/1080.

 

En dehors de la taille et donc du nombre d'unités composant ce GPU, la principale différence avec les autres puces Pascal provient du process de gravure : en lieu et place du 16 nm de TSMC, le caméléon a opté pour le 14 nm de Samsung. De type FinFET (transistors "3D") également, il dispose d'un avantage d'environ 9 % au niveau de la densité. C'est ce procédé sous licence qui a été employé par GlobalFoundries pour la production des puces Polaris d'AMD.

 

Diagramme logique GP107 [cliquer pour agrandir]

Le diagramme logique du GP107

 

La taille réduite permet d'abaisser significativement les coûts de production (plus de GPU par wafer), reste à réaliser les arbitrages les plus pertinents possible quant à l’allocation des transistors pour un GPU de cet acabit. Le caméléon a utilisé une approche différente de celle qui avait été la sienne pour la précédente puce de cette gamme. Si le nombre de TPC/SM (Streaming Multiprocessor) ne connaît qu'une légère inflation (5 → 6), ces derniers sont à présent répartis au sein de 2 Graphics Processor Cluster au lieu d'un seul sur GM107, à raison de 3 par GPC contre 5 pour les autres puces Pascal.

 

Cela permet ainsi de doubler les unités de rastérisation (découpe triangles en pixels) et la génération de triangles par cycle (2). Du côté interface mémoire et cache, GP107 utilise 4 contrôleurs mémoire 32-bit et un cache L2 à 1 Mo tout en profitant à l'instar de toutes les puces Pascal, de l'amélioration des algorithmes de compression couleur sans perte (Delta Color). Les ROP sont doublés par rapport à GM107, à 32. En faisant les comptes, on obtient donc 768 unités chargées des calculs, 48 pour le texturing, un bus 128-bit et 32 ROP pour l'écriture mémoire.

  

 

• Spécifications des cartes

Alors qu'il y a un an, AMD utilisait pour la RX 460 un GPU avec une partie de ses unités désactivée, ce n'est plus le cas de la RX 560 qui profite, cette fois, d'un Baffin bel et bien complet ! Chemin inverse pour NVIDIA en passant de la 1050 Ti à la 1050, le GP107 perd de son côté un SM. De quoi annoncer un duel plus serré entre ces deux-là, puisque la GTX 1050 Ti devançait de la tête et des épaules la RX 460 lors de notre test à l'époque. Voyons donc plus précisément les caractéristiques des cartes actuelles (et quelques passées) de cette gamme.

 

rx460 2

 

CartesArchitectureFréquence GPU (MHz)Fréquence Mémoire (MHz)Unités de calculTMUROPTaille mémoire (Go)Bus mémoire (bits)Calcul SP (Gflops)Bande Passante (Go/s)
HD 7790 GCN 2 1000 1500 896 56 16 1 128

1792

96
R7 260X GCN 2 1100 1625 896 56 16 2 128 1971 104
R7 360 GCN 2 1050 1625 768 48 16 2 128 1613 104
R7 370 GCN 1 975 1400 1024 64 32 2 / 4 256 1997 179
RX 460 GCN 4 1090 à 1200 1750 896 56 16 2 / 4 128 1953 à 2150 112
RX 560 GCN 4 1175 à 1275 1750 1024 64 16 2 / 4 128 2406 à 2611 112
GTX 750 Maxwell 1019 à 1084 (mini) 1250 512 32 16 1 128 1043 à 1110 80
GTX 750 Ti Maxwell

1019 à 1084 (mini)

1350 640 40 16 2 128 1304 à 1388 86
GTX 950 Maxwell 2 1024 à 1188 (mini) 1650 768 48 32 2 / 4 128 1573 à 1825 106
GTX 1050 Pascal 1354 à 1455 (mini) 1752 640 40 32 2 128 1733 à 1862 112
GTX 1050 Ti Pascal 1290 à 1392 (mini) 1752 768 48 32 4 128 1981 à 2138 112

 

1050ti

 

La GTX 1050 se "contente" donc d'un GPU dont un TPC/SM a été désactivé (-16,6%) par rapport à celui de la 1050 Ti. La fréquence de ce dernier est toutefois en hausse (théorique) de 62 MHz (+4.5%). La bande passante étant similaire, la GTX 1050 équipée de 2 Go (4 pour la Ti) de GDDR5, n'est donc pas très éloignée de sa grande sœur en termes de performances (pour peu que la quantité de mémoire ne soit pas un facteur limitant) et en conséquence mène la vie difficile à la RX 460. C'est pourquoi AMD s'est décidé à lancer la RX 560 disposant d'un GPU complet et un petit boost de fréquence pour proposer une puissance de calcul/texturing en hausse d'un peu plus de 20 %. De quoi revenir à niveau, voire dépasser la GTX 1050 ? C'est ce que nous allons tâcher de vérifier dans les pages suivantes.

 





Les 8 Ragots
   
Les ragots sont actuellement
prévention anti troll, loguez-vous !ouverts aux ragoteurs logués