Puissexpress • R580 vs G71, quoi de neuf depuis un an? |
————— 21 Mars 2007
Puissexpress • R580 vs G71, quoi de neuf depuis un an? |
————— 21 Mars 2007
Match R580 vs G71, quoi de neuf depuis un an?
Bien que l'introduction du G80 ait quelque peu changé la donne, surtout d'un point de vue tarifaire, les cartes basées sur le R580 (X1900) et sur le G71 (7900) sont légions et constituent généralement l'offre entrée/moyen de gamme pour joueurs. Relativement proches en terme de performances pures il y a un an, cette équivalence n'est plus d'actualité avec les jeux du moment. Ces différences de performances, que l'on observe de plus en plus, sont surtout la conséquence d'une différence d'architecture.... mais pas seulement.

• Théorie
Etudions très succinctement et grossièrement l'approche et l'implication architecturale du R580 et du G71.
- Ati et son R580.

Le R580 est l'évolution du R520, ou plutôt sa correction. Ce dernier, malgré une architecture novatrice et prometteuse, était en fait gravement déficient en puissance de calcul : le G71 a 48 unités de calcul (2 dans chaque pipeline de pixel shading) et le R520 n'en a que 16.
La puissance de calcul, déterminée, théoriquement, par le nombre de Ps Pipelines, est très importante pour l'exécution des shaders complexes, et n'avoir "que" 16 Unités dédiées à leurs traitements peut avoir des conséquences néfastes avec les jeux les plus lourds. C'est effectivement le cas maintenant, avec les jeux les plus récents, nécessitant une puissance de calcul conséquente, on pensera notamment à Nfs Carbon ou encore au dernier Rainbow 6. C'est également le cas dès que l'on passe en mode HDR, qui nécessite aussi une puissance de calcul adéquat. Ainsi, les cartes à base de R520 (X1800xt etc) voient leurs performances s'effondrer avec les jeux les plus récents et chuter sensiblement en mode HDR.
Le R580 est donc venu à la rescousse, en gardant les bases architecturales du R520 tout en remédiant à son plus grave défaut.
Ayant pour socle le R520, le R580 mise tout sur une architecture de type dissociée, ou Ultra Threading.
Contrairement au G71, le R580 (comme le R520) adopte une architecture qui consiste à découpler les pipelines de traitement de pixel shaders des unités de texturings. Grossièrement, le découplage des pipelines permet de gagner en flexibilité puisqu'il est possible de travailler sur un petit groupe de pixels et d'en utiliser un grand nombre pour le même résultat (contrairement au Long Pipeline du G71, qui impose de travailler sur un très grand groupe de pixels).
La gestion des branchements, qui facilite l'écriture de certains shaders et l'efficacité d'autres, est donc très efficace puisque le R580 dispose d'une unité de traitement dédiée.
Il n'est pas encore question d'un pipeline unifié, capable de traiter aussi bien les vertex que les pixels shaders, même si avec le R580 on s'en rapprorche d'un point de vue fonctionnel.
Gérant les PS3, le HDR et le HDRr+FSAA (blending fx10/fx16), les X19xx les plus puissantes proposent 16 Unités de texturing et 48 Ps Pipelines (X1950xt 256/512). Les déclinaisons moyen de gamme en proposent 12/36 (X1950pro, X1950gt) et enfin 8/24 pour l'entrée de gamme (X1650xt).
Ainsi, sur le papier, les cartes basées sur le R580 sont dotées d'une grande puissance de calcul, ce qui a comme conséquence directe une efficience théorique particulièrement grande avec les jeux lourds en shaders complexes. La puissance en texturing est, elle, bien moins impressionnante, en retrait même face au G71, bien que partiellement compensée par le contrôleur mémoire intégré de type Ring Bus, et l'introduction du Fetch4 qui facilite théoriquement l'accès aux textures.
Ati a donc tacitement fait le pari que les jeux nécessiteraient de plus en plus de ressource en puissance de calcul, au détriment du texturing pur.
-Nvidia et son G71.
.jpg)
Essentiellement un die shrink du G70, lui même issu du NV40, le G71/G73 est l'ancienne gamme de Nvidia. Ancienne puisque le G80 est désormais le gpu le plus récent du moment. Ancienne de part son âge, et son architecture, les cartes à base de G71 (79xx/7600) sont pourtant encore bien présentes (en attendant la relève dx10), puisque les 7600gs/7600gt/7900gs et 7950gt constituent l'entrée de gamme et le moyen de gamme pour joueurs chez Nvidia.
Ayant pour architecture fondatrice le NV40 (6800), le G71 mise tout sur une architecture de type Longue Pipeline. Grossièrement, chez Nvidia (avant le G80), les pipelines ne sont pas dissociées. Ainsi, il y a 2 unités de calcul par pipeline de traitement de pixel shaders. Ces unités de calcul spécifiques sont donc dédiées à telle ou telle tâche et en engendrent ainsi un cheminement linéaire des pixels.
Gérant le HDR (uniquement FP16) et les PS3, cette puce contient 24 Unités de texturing et 24 Ps Pipelines pour les 7900gtx/7950gt et 7900gt, 20/20 pour la 7900gs et 12/12 pour les 7600. Le G71 est donc un gpu particulièrement puissant en texturing.
Pas en puissance de calcul? Sur le papier, on note déjà une puissance moindre que chez les x19xx, qui possèdent plus de PS Pipelines, mais c'est surtout l'architecture qui pose problème avec le G71, notamment lors des branchements dynamiques. En effet, si une telle architecture permet de palier relativement bien un temps d'accès significatif à la texture, il en découle que si, pour une quelconque raison, un accés à texture perdure, l'effet palliatif est perdu, ce qui entrainera un arrêt du pipeline d'où découlera une baisse de performances. Et c'est effectivement ce qu'il se passe dés que l'on parle de Branchement Dynamiques, ce qui nous renvoie aux traitements des Pixels Shader et c'est, en définitive, la puissance de calcul qui est mise à mal.
Si cette déficience architecturale passait relativement inaperçue il y a un an, avec des jeux à grandes doses de texturing et de shader peu complexes, aujourd'hui c'est beaucoup plus visible. En effet, les tous derniers jeux nécessitent une puissance de calcul importante et efficace (architecture adéquat).
Nvidia a donc préféré garder les bases de son fameux NV40, en le réduisant en terme de taille (puce)/consommation, tout en grossissant les unités de calcul, en les optimisant et en ajoutant quelques fonctionnalités. L'efficacité en texturing pur est réelle, la gestion HDR l'est aussi relativement (bien que moins souple que chez ATI), la petite taille du G71 est impressionnante, sa consommation très modeste. En revanche, la puissance de calcul, déjà théoriquement inférieure au R580, est partiellement gâchée pour une architecture non adéquat, ce qui est source de conséquences fâcheuses actuellement.
• En Pratique
Dans cette partie, nous verrons, à l'aide d'un test présentant un panel de jeux particulièrement intéressant, puisque très récents et lourds, comment cette différence d'architecture, entre autre, peut influer sur les performances ludiques et chambouler le classement "traditionnel" des différentes cartes du moment.
7 jeux très récents ont été isolé, de façon à écarter ceux trop "anciens", tel que Quake 4, Far Cry, Doom 3 et autre Half-Life 2. Des jeux qui, de toute façon, ne nécessitent pas forcément des cartes puissantes pour être agréables à jouer. Est-il vraiment nécessaire de bencher des cartes si puissantes avec des jeux qui commencent à se faire vieux, offrant aisément 50/60fps et plus, avec des réglages relativement lourds, et cela même sur des cartes moyen de gamme, alors que nous avons des jeux nettement plus récents, plus complexes, et sans doute plus représentatifs des jeux à venir ? Je pense que l'on pourrait s'en passer, ou du moins prendre surtout en compte les jeux les plus récents, mais ce n'est là qu'un avis purement subjectif.
Oblivion, malgré sa lourdeur, a été également écarté, car spécialement optimisé pour les cartes Ati.
Ainsi, nous avons :
Gothic 3 : juillet 2006
Company of Heroes : septembre 2006
Call of Juarez : septembre 2006
Nfs Carbon : novembre 2006 (cf ce test)
Anno 1701 : novembre 2006
Splinter Cell 4 : novembre 2006
Rainbow Six Vegas (basé sur l'Unreal Engine 3) : décembre 2006
Méthodologie :
La moyenne des FPS (images par seconde) des 7 jeux a été calculée pour chaque carte. Ensuite, les résultats ont été normalisés en fonction de la 8800gts 320 (indice 100). Cette méthodologie est plus parlante qu'une simple moyenne de FPS, le but n'étant pas de voir la fluidité générale de chaque carte, mais plutôt les différences de performances pures.
Graphique:

Les résultats en 1280x1024 ne changent pas le classement. Les résultats avec filtres n'ont pas été intégrés car certains jeux étaient testés en mode HDR + FSAA, or les gpu à base de G71 ne sont pas compatibles avec un tel mode.
Les choses sont claires, les x19xx/x1650xt dominent les 79xx/7600. Par contre, le G80 met tout le monde d'accord. Notez la différence de performances entre la 8800gtx et les autres cartes ancienne génération.
Une X1950pro se retrouve ainsi au niveau d'une 7900gtx, et une X1650xt au niveau d'une 7900gs.
Pourquoi ? Il y a plusieurs pistes.
1) La puissance de calcul supérieure sur les cartes Ati (48/36/24 Ps Pipelines vs 24/20) et la gestion des branchements bien plus efficace sur le R580, les jeux testés étant très friands de la combinaison des deux.
2) Les drivers G71 ne sont plus autant optimisés qu'avant, Nvidia préférant logiquement se pencher sur ceux du G80 + Vista. Au contraire, Ati continue encore ses optimisations.
3) Les jeux seraient, tous, spécialement optimisés pour le R580.
4) Le test est faux.
En résumé, la solution est la synthèse du 1) et du 2).
Il parait évident que l'architecture du R580 est plus apte à faire tourner les jeux lourds en shaders complexes que celle du G71.
Mais cette constatation technique et empirique n'en serait que partielle si l'on exclu l'optimisation drivers, qui est, fatalement, moins efficace qu'avant, le G80 monopolisant les ressources.
Pourtant, la tendance générale, concernant la 3D ludique, est celle de l'utilisation massive de shaders complexes, constitués d'énormes instructions mathématiques. Dés lors, le G71, à l'architecture trop rigide, ne peut espérer tenir tête au R580, plus souple, plus avancée et de toute façon originellement supérieure en puissance de calcul.
• Bilan et perspectives

Les choix de Ati, initialement accueiillis avec réserves, sont donc probants.
De son côté, Nvidia, avec un G71 à l'architecture relativement éprouvée, rencontre quelques difficultés dès qu'il s'agit de jeux particulièrement lourds. Ajouter à cela une optimisation divers qui occupe moins de place qu'avant, et nous avons un G71 qui vieillit mal.
On remarquera aussi que la gestion des 256mo de mémoire est parfois douteuse avec les gpu à base de G71/73. Nous le constatons surtout ici.
Dernière remarque, l'OpenGL, historiquement l'apanache de Nvidia, n'est plus vraiment l'atout maître des 7600/7900 (du moins d'un point de vue ludique, pour Linux c'est autre chose). Ainsi, les X19xx ne voient pas leurs performances véritablement chuter sous Doom 3, Quake 4, Pacific Figthers ou encore Prey .
Toutes ces constatations, d'ordres techniques, en amènent d'autres, plus pragmatiques. En effet, ceux qui veulent changer leur carte aujourd'hui et qui disposent d'un budget inférieur à 250 euros, ont tout intérêt à se tourner vers des cartes Ati. A prix du même ordre, on préfèrera une X1650xt à une 7600gt, une X1950gt/pro à une 7900gs et une X1950xt 256 à une 7950gt.
La 8800gts 320 étant un choix de premier ordre, le seul, quand on dispose de 300 euros. Plus généralement, Nvidia n'a aucune concurrence dés que l'on dépasse les 300 euros, les déclinaisons G80 dominant sans partage.
Globalement du même niveau avec un panel de jeux "classiques" (même si léger avantage à Ati), sous les jeux les plus récents, il n'est pas rare de voir une X1950pro talonner, voir égaler une 7900gtx. L'inverse, en revanche, est faux. Ainsi, une 7900gt ne sera jamais du niveau d'une X1950xtx... sauf peut être sous Tomb Raider, et à condition de ne pas utiliser le mode Next Gen, mais dans les deux cas le framerate sera très confortable.
Il faut ajouter à cela le côté fonctionnel, plus intéressant chez Ati. Ainsi, le HDR + FSAA est de la partie, le filtrage anisotropique est de qualité supérieure. Le G71 a l'avantage ailleurs. En effet, il garde pour lui une faible consommation et une capacité d'overclocking généralement bien meilleure.
Les derniers jeux étant particulièrement demandeurs en puissance de calcul, il parait évident que la tendance ne va pas s'inverser, à l'heure où les shaders permettent d'appliquer des fonctions mathématiques complexes sur les pixels et les textures.
De la puissance de calcul du R580 et dérivés, ainsi que la flexibilité générale de l'architecture, il résultera, peut être, de meilleures performances avec des jeux comme Crysis ou Unreal Tournament 3 (de futurs hits), en mode dx9 bien sûr, et peut être d'autres encore.
C'est ici l'occasion de se rendre compte du chemin parcouru par Nvidia pour palier, et aller au-delà, les soucis du G71. Ainsi, le G80 est actuellement le gpu le plus efficace et un gouffre le sépare du G71, tant bien au niveau architectural, que des performances pures. Cumulant puissance de calcul et de filtrage, le tout agencé sur une architecture unifiée de type Scalaire, les performances sont tout premier ordre. Le G80 est de loin plus apte à affronter les jeux lourds que ne l'est le G71. Ainsi, une 8800gtx est aisément 2/3 fois plus performante qu'une 7900gtx avec les jeux les plus gourmands du moment !
Si le R580 montre indubitablement toute sa force actuellement, si il domine nettement le G71 sous les jeux les plus récents, Nvidia, en proposant relativement tôt son premier gpu DX10 et en faisant table rase du passé, est incontestablement revenu sur la première marche du podium... pour l'instant. Voilà un beau défi pour Ati.
Le match G80 vs R600 promet d'être passionnant !
|
|