• GP107

Avant de décrire la carte que nous a fait parvenir ZOTAC pour le compte de NVIDIA, passons en revue les principales caractéristiques de son nouveau GPU aka GP107. Ce dernier se contente de 132 mm² pour 3,3 milliards de transistors, soit une taille (+7%) et densité proches de celles de Baffin (123 mm² / 3 Mds). Par rapport à GM107 (148 mm² / 1.87 Mds), cela permet de produire une puce 17% plus petite, mais disposant de 75% de transistors suppémentaires. C'est bien entendu l’architecture Pascal qui est à la manœuvre, pour les détails concernant cette dernière, nous vous invitons à vous référer à la page qui lui est dédiée dans le dossier GTX 1070/1080.

 

En dehors de la taille et donc du nombre d'unités composant ce GPU, la principale différence avec les autres puces Pascal provient du process de gravure : en lieu et place du 16 nm de TSMC, le caméléon a opté pour le 14 nm de Samsung. De type FinFET (transistors "3D") également, il dispose d'un avantage d'environ 9% au niveau de la densité. C'est ce procédé sous licence qui a été employé par Global Foundries pour la production des puces Polaris d'AMD. Compte tenu de l'avantage en termes de fréquence et de consommation des puces de la génération Pascal gravées en 16 nm, il sera intéressant de vérifier si ces points sont toujours d'actualité avec ce GP107.

 

Diagramme logique GP107 [cliquer pour agrandir]

Le diagramme logique du GP107

 

La taille réduite permet d'abaisser significativement les coûts de production (plus de GPU par Wafer), reste à réaliser les arbitrages les plus pertinents possible quant à l’allocation des transistors pour un GPU de cet acabit. Le caméléon a utilisé une approche différente de celle qui avait été la sienne pour la précédente puce de cette gamme. Si le nombre de TPC/SM (Streaming Multiprocessor) ne connaît qu'une légère inflation (5 → 6), ces derniers sont à présent répartis au sein de 2 Graphics Processor Cluster au lieu d'un seul sur GM107, à raison de 3 par GPC contre 5 pour les autres puces Pascal. Cela permet ainsi de doubler les unités de rastérisation (découpe triangles en pixels) et la génération de triangles par cycle (2).

 

Du côté interface mémoire et cache, GP107 utilise 4 contrôleurs mémoire 32-bit et un cache L2 à 1 Mo tout en profitant à l'instar de toutes les puces Pascal, de l'amélioration des algorithmes de compression couleur sans perte (Delta Color). Les ROP sont doublés par rapport à GM107 à 32, toutefois ils ne pourront pas être saturés (hors MSAA) puisque les 6 SM ne sont capables de débiter "que" 24 pixels par cycle (4 pixels 32-bit / SM), ce qui limitera ainsi la progression du fillrate à +50% par cycle d'horloge. En faisant les comptes, on obtient donc 768 unités chargées des calculs, 48 pour le texturing, un bus 128-bit et 32 ROP pour l'écriture mémoire.

 

Tout cela n'est guère impressionnant d'un point de vue progression des unités de calcul et texturing et ce malgré le changement de process de gravure, toutefois l'augmentation sensible des fréquences de fonctionnement (un peu moins de 30% tant pour le GPU que la mémoire) devrait encore avoir un effet notable comme ce fut le cas des précédents GPU 2016 du caméléon. Le moteur vidéo est similaire aux autres puces Pascal (limité à la prise en charge de 3 écrans simultanés sur cette gamme de cartes) supportant les normes HDMI 2.0B et DP 1.3/1.4. Côté décodage/encodage, on conserve les capacités du GP104. Enfin, GPU Boost 3.0 et Fast Sync répondent eux aussi présents à l'instar des GP102/104/106.

 

Finissons par le Simultaneous Multi-Projection qui pourrait s'avérer un avantage décisif en VR voire au-delà en réduisant les calculs nécessaires en périphérie de l'affichage. Nous avons eu l'occasion de tester brièvement Shadow Warrior 2 qui utilise les capacités du SMP et en particulier le Multi-Res Shading qui autorise une dégradation de la définition sur une partie de l'image à calculer. Toute l'astuce consiste à réduire là où le joueur ne focalise pas son attention, surtout en pleine action. Pour cette première utilisation, il est possible de régler la taille de la zone à "dégrader" et le niveau de la baisse de résolution. Nous avons mesuré des gains pouvant aller jusqu'à 20% avec des impacts visuels notables que l'on oublie toutefois rapidement en pleine action.

 

mrsPrincipe de fonctionnement du Multi-Res Shading

 

Pour rappel le SMP n'est en rien une exclusivité de ce GP107 puisqu'on le retrouve sur les GP102/104/106, quant au MRS, il est également comptabible avec les puces Maxwell 2. Voilà pour ce nouveau GPU, voyons à présent comment le caméléon l'a décliné dans sa gamme de cartes graphiques.

 

 

• Spécification des cartes

Pour les 2 premières mise en oeuvre de GP107 dans le monde desktop, NVIDIA utilise un GPU complet sur la GTX 1050 Ti, mais désactive un SM sur la GTX 1050 qu'il positionne en face de la RX 460 du concurrent, employant elle aussi une puce incomplète afin de réduire les coûts (via recyclage des puces pas totalement fonctionnelles) comme à l'accoutumée dans le monde des GPU. Existera-t-il une carte graphique utilisant un Polaris 11 complet vu la concurrence de la GTX 1050 Ti à présent ? À voir, mais la réactivation de 12.5% d'unités de calcul/texturing sans augmentation sensible de la fréquence, ne devrait pas changer significativement le rapport de force. Voyons donc les caractéristiques des GTX 1050 en comparaison de la plupart des cartes de cette gamme.

 

CartesArchitectureFréquence GPU (MHz)Fréquence Mémoire (MHz)Unités de calculTMUROPTaille mémoire (Go)Bus mémoire (bits)Calcul SP (Gflops)Bande Passante (Go/s)
HD 7790 GCN 2 1000 1500 896 56 16 1 128

1792

96
R7 260X GCN 2 1100 1625 896 56 16 2 128 1971 104
R7 360 GCN 2 1050 1625 768 48 16 2 128 1613 104
R7 370 GCN 1 975 1400 1024 64 32 2 / 4 256 1997 179
RX 460 GCN 4 1090 à 1200 1750 896 56 16 2 128 1953 à 2150 112
GTX 750 Maxwell 1019 à 1084 (mini) 1250 512 32 16 1 128 1043 à 1110 80
GTX 750 Ti Maxwell

1019 à 1084 (mini)

1350 640 40 16 2 128 1304 à 1388 86
GTX 950 Maxwell 2 1024 à 1188 (mini) 1650 768 48 32 2 / 4 128 1573 à 1825 106
GTX 960 Maxwell 2 1126 à 1178 (mini) 1753 1024 64 32 2 / 4 128 2306 à 2413 112
GTX 1050 Pascal 1354 à 1455 (mini) 1752 640 40 32 2 128 1733 à 1862 112
GTX 1050 Ti Pascal 1290 à 1392 (mini) 1752 768 48 32 4 128 1981 à 2138 112

 

1050ti

 

La GTX 1050 Ti utilise donc une version intégrale du GP107. Le GPU dans cette configuration ressemble comme deux gouttes d'eau à celui intégré sur la GTX 950 (pour ses caractéristiques principales), il profite par contre des atouts liés à Pascal dont l'amélioration de la compression Delta Color et les fréquences en hausse notable. Face à la RX 460, la puissance de calcul est similaire (mais ne prend pas en compte l'apport des unités SFU des GeFORCE) tout comme la bande passante mémoire. Le fillrate et dans une moindre mesure le texturing sont en faveur de la carte du caméléon. La 1050 Ti embarque 4 Go de mémoire à 7 Gbps, soit davantage que la 1060 3 Go pourtant bien plus puissante. Face à la GTX 750 Ti à qui elle succède réellement (la 950 étant basée sur une puce xx6), le fillrate progresse de 90%, la puissance de calcul et le texturing de 54%, et la bande passante de 30%.

 

La GTX 1050 de son côté voit la désactivation d'un TPC/SM (-16.6%), mais la fréquence GPU est en hausse de 62 MHz (+4.5%). La bande passante est similaire, la GTX 1050 ne devrait donc pas être très éloignée de sa grande soeur en termes de performances et en conséquence mener la vie difficile à la RX 460 avec laquelle elle partageait le tarif avant la baisse de 10$ décidée récemment par AMD. Par rapport à la GTX 750 Ti, elle partage nombre de caractéristiques, mais double les ROP et profite à nouveau de fréquences en hausse notable (et optimisations liées à Pascal). La GTX 1050 n'est sensée embarquer que 2 Go de mémoire à 7 Gbps, nul doute que des versions 4 Go verrons toutefois le jour. Face à la GTX 750, le fillrate, la puissance de calcul et le texturing progressent de 67%, la bande passante de 40%. Passons au concret page suivante avec une GTX 1050 Ti restant dans l'enveloppe des 75W.

 





Les 26 Ragots
   
Les ragots sont actuellement
prévention anti troll, loguez-vous !ouverts aux ragoteurs logués