• Cypress

Commençons par celui qui se cache sous les HD5800 : Cypress. Il reprend pour simplifier à l'extrême le design du RV770 et double toutes les données techniques. Cela mérite une explication. AMD a passé la gravure de ses GPU au 40nm, contre 55 à la génération précédente à l'exception de la HD4770, ce qui a permis une augmentation du nombre de transistors impressionnante puisque désormais égal à 2.15 milliards, et on les a compté ! Ainsi on a non plus 800 mais 1600 unités de calcul équivalent scalaire. la HD4870 possédait 160 grosses unités de calcul capables de traiter 4+1 calculs simultanément, soit 160vec5 ou équivalent 800 unités scalaires. La HD5870 possède donc 320vec5 soit l'équivalent de 1600 unités scalaires, qui est le type d'architecture des GT200 et consorts depuis le G80. La HD5850 quant à elle se contente de 288vec5 soit 1440 unités de calcul.

 

Ce n'est évidemment pas tout puisque les ROPs ont aussi subi un gavage en passant de 16 à 32 sur les cartes HD5800. Ces unités de calcul ont pour rôle d'écrire en mémoire les données, c'est donc elles qui s'occupent des filtres comme l'antialiasing. Enfin les TMUs qui sont les unités chargées du texturing passent de 40 à 80.  Pour terminer, le RV870 est particulièrement à l'aise lors des opérations de Geometry Shader, grâce à son énorme puissance de calcul (plus de deux teraflops) mais surtout grâce à la présence d'un cache généralisé et la possibilité de "virtualiser" à l'infini les registres du GPU via la mémoire vidéo et donc limiter au maximum les pertes lors des calculs nécessitant le stockage de nombreux résultats, outrepassant la capacité en registres de la puce. Les GeForce sont, elles ,dans ce cas de figure, particulièrement handicapées.

 

 

diagramme architecture hd5870 hd5850

 

 

Autre point sur les Cypress et leur architecture de type vectoriel : ce choix va dans la continuité de ce qui avait été entamé avec les cartes basées sur le R600, il présente des avantages mais aussi des inconvénients. D'une part les unités Nvidia sont "double pumped", c'est à dire traitant deux calculs par cycle d'horloge et d'autre part les unités scalaires disposent d'un meilleur rendement que les vectorielles, dont il est difficile de tirer la quintessence même avec un compilateur aux petits oignons. Difficile donc de connaitre précisément les forces en présence juste à la lecture des caractéristiques respectives, tout au plus sait-on que le RV870 ou Cypress dispose de plus de 2 fois la puissance de calcul du RV770, HD5850 y compris malgré ses unités en moins.

 

Le bus mémoire quant à lui reste cantonné au 256 bits via 4 contrôleurs 64 bits ayant chacun une mémoire cache L2 de 128Ko doublée par rapport aux HD4870, une largeur de bus plus grande aurait inévitablement induit une puce plus complexe à mettre au point et des coûts supérieurs. AMD devant les difficultés rencontrées par TSMC à produire son GPU en 40 nm n'a certainement pas voulu courir ce risque. En contrepartie AMD emploie de la GDDR5 de nouvelle génération, la 4è déjà, rapide puisque celle-ci a une fréquence de 1200 MHz ce qui correspond à 4800 MHz effectifs et offre ainsi une bande passante de 153.6Go/s pour la HD5870 et de 128 Go/s pour la HD5850, cette dernière employant de la GDDR5 plus lente à 1000 MHz.

 

• Juniper

C'est une version allégée de Cypress puisque grosso modo c'est une moitié de Cypress. On retombe alors sur un RV770 me direz-vous  ! Pas totalement cependant mais les ressemblances sur le papier sont effarantes, à tel point que l'on pourrait presque dire que c'est un die shrink du RV770. Les cores ont une fréquence de 850 MHz pour la HD5770 contre 750 pour le RV770, la partie mémoire diffère également puisque de 900 on passe à 1200 MHz de GDDR5, le bus quant à lui étant réduit à 128 bits. De ce fait la HD5770 dispose d'une bande passante de 76.8 Go/s contre 115.2 Go/s au RV770. Le reste des caractéristiques restant identique, à savoir 800 unités équivalent scalaire (160vec5), 16 ROPs et 40 TMUs. La grande question est de savoir si la HD5770 saura compenser par sa fréquence GPU ce qu'elle perd en bande passante mémoire face au RV770. Pour finir elle est gravée elle aussi en 40nm, contre 55nm à la génération antérieure, le nombre de transistors est par contre en légère hausse avec pas moins de 1.04 milliards de transistors contre 965 millions au RV770, le gain issue de la suppression de 2 contrôleur mémoire 64 bits et entièrement consommé par les nouvelles fonctionnalités (DX11) de la puce . 

 

diagramme architecture hd5770

 

Les caractéristiques des cartes sont résumées dans le tableau ci-dessous.

 

tableau specifications radeon hd5870 hd5850 hd5770

 

• DX11

Ces deux familles de cartes sont donc les premières à supporter officiellement D3D11 ou DX11 dans le langage populaire. Elles profitent de la seconde génération de gravure à 40nm et de la quatrième génération de GDDR5. AMD appuie énormément sur DX11 surtout face à son rival vert qui met plutôt en avant Cuda et PhysX vu son retard sur cette génération. Parmi les nouveautés introduites avec DX11, on compte la Tesselation qui est la faculté de multiplier le nombre de polygones constitutifs d'une scène afin d'en améliorer le rendu visuel, DirectCompute11 qui est la faculté du GPU de traiter des tâches qui sont parallélisables afin d'en accélérer le traitement via des applications compatibles, les Shader Models passent en version 5 et enfin le multi-threading fait son apparition. Ce dernier était déja plus ou moins présent mais peu ou très mal exploité par DX10/DX10.1. Cette fois son support est total et il permettra aux possesseurs de processeurs multi-coeurs de profiter d'un bonus de performance grâce à une répartiton harmonieuse des calculs sur l'ensemble des cores, réels et/ou virtuels. AMD a aussi ajouté un support complet de l'OpenCL 1.0 et a implémenté l'Eyefinity qui permet de brancher pour l'instant jusqu'à 3 écrans sur la carte. Autre nouveauté, AMD a peaufiné la qualité de son filtrage anisotrope qui bénéficie d'une réduction d'effet d'angle grâce à un nouvel algorythme, tout ça sans perte de performance selon AMD. Pour conclure là dessus les cartes DX10 et DX10.1 ne sont pas complètement exclues des avancées de DX, mais le support des routines sera forcément imparfait et les effets DX11 ne seront pas gérés en hardware :

 

dx10 dx11 tesselation sm5 [cliquer pour agrandir]  dx11 dirt2 tesselation hd5870 [cliquer pour agrandir]

 

Voilà ce qu'est censé supporter Dirt2 qui est à AMD ce que Batman est à Nvidia : une vitrine technologique réussie. Ce jeu sera le premier natif à supporter DX11, Battleforge le supportant depuis la mise à disposition d'un patch depuis quelques jours.

 




Les 34 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !