COMPTOIR
  
register

Test • AMD RADEON HD 6900

• Cayman, une architecture revue !

Avec le lancement de BARTS il y a deux mois, AMD s'était contenté de réemployer la même architecture vectorielle à 5 composantes (VEC5 ou VLIW5) utilisée depuis le R600 et bien sûr optimisée/adaptée suivant les puces. Cette architecture permet de loger un grand nombre d'unités de calcul dans le GPU et ainsi afficher des chiffres de puissance brute faramineux toujours bons pour le marketing.

 

Le souci d'une telle approche provient du fait que les instructions doivent être fortement parallélisées pour tirer partie des 5 composantes par cycle, cette tâche étant dévolue au compilateur qui optimise au mieux, mais en pratique le rendement de ces unités n'est pas très efficient a contrario des unités scalaires utilisées par nVIDIA depuis son G80. AMD a décidé avec Cayman, sa nouvelle puce haut de gamme, de revenir à une architecture à 4 vecteurs à l'instar des X1800/1900 afin de limiter les contraintes d'optimisation des instructions et ainsi gagner en efficacité.

 

hd6900 - unité Vec4 

Unité VLIW4

 

Notons que nous étions auparavant dans une architecture du type Vec4+1, toutes les unités n'étant pas égales en termes de fonctionnalités (l'unité supprimée est celle qui était chargée des calculs complexes qui seront dorénavant exécutés par décomposition en opérations simples successives), ce n'est plus le cas à présent. Bien sûr, une telle architecture demandera toujours beaucoup d'optimisation côté compilateur pour réagencer au mieux les instructions envoyées au GPU, reste qu'elle devrait être plus efficace que la précédente. Comment AMD s'y est-il pris pour concevoir Cayman, jetons un coup d'oeil au diagramme de cette puce :

 

Diagramme Cayman

Diagramme Cayman

 

Le GPU s'agence toujours autour de 2 gros SIMD Engines composés chacun de 192 unités VLIW4 soit un total de 1536 SP pour Cayman. Ce chiffre est en berne par rapport à Cypress puisque ce dernier en embarquait pas moins de 1600, nous verrons si le fait de passer de VEC5 à VEC4 compensera cette baisse ! Point notable, cette modification des unités de calcul conduit mécaniquement à l'augmentation du nombre de blocs regroupant ces dernières par SIMD Engine (passage de 10 à 12  blocs). De ce fait, le nombre de TMU augmente dans la même proportion puisque le ratio de 4 unités de texturing par bloc d'ALU est conservé portant donc ces dernières à 96 sur Cayman contre 80 à Cypress. Enfin, AMD est parvenu cette fois a intégrer deux Graphics/Setup Engine permettant dès lors de traiter 2 triangles par cycle alors que ce n'était pas le cas sur Cypress et que nVIDIA dispose de 4 Setup Engine depuis l'avènement de Fermi.

 

Dual Graphics Engine 

Les 2 Graphics Engine de Cayman

 

En conséquence, ce dédoublement du Setup Engine permet à Cayman de se parer de deux unités de Tesselation contre une seule sur les précédents GPU d'AMD, qui plus est plus performantes que celle équipant BARTS (Gen 8 vs 7) déjà en progrès par rapport aux RADEON 5xxx. En effet, elles disposent toujours d'un tampon plus large que celui intégré à l'unité de tesselation des Cypress, mais elles peuvent également utiliser la mémoire vidéo en cas de saturation de ce dernier, supprimant ainsi les risques d'engorgement bloquant le GPU lors d'une utilisation intensive de la tesselation. Si AMD n'a pas changé la largeur du bus mémoire qui reste à 256 bits, les ROP qui permettent d'écrire dans la mémoire ont été légèrement revus afin d'améliorer les vitesses d'exécution de certaines opérations (32 Bits flottants, 16 bits entiers) dont le filtrage AA qui devrait "coûter moins cher" que sur Cypress.

 

ROP Cayman

Des ROP optimisés

 

Au final Cayman se trouve être une puce légèrement plus imposante que Cypress avec 2,64 Milliards de transistors contre 2,15 pour 389 mm² de silicium (334 sur Cypress). On reste donc à ce niveau bien inférieur au GF110, le coût de fabrication de Cayman doit donc être moindre pour AMD qu'il ne l'est pour la puce du caméléon, de quoi contre-balancer le surcoût mémoire puisque AMD a décidé d'accompagner son nouveau GPU de 2 Go de GDDR5 très rapide contre 1,5/1,2 moins rapide (donc moins coûteuse) vu l'avantage en terme de bande passante du bus mémoire plus lage sur Fermi.

 

AMD profite de la sortie de Cayman pour introduire sa technologie PowerTune. Késako ? En fait il s'agit de contrôler dynamiquement le TDP du GPU en ajustant à la baisse la fréquence en temps réel suivant la sollicitation rencontrée. De fait, ce mécanisme permet d'abaisser la consommation lors de passages moins chargés mais aussi d'éviter les surchauffes lors de passages trop sévères, au détriment des performances toutefois. Tout cela est paramétrable dans l'overdrive des Catalyst via un slide qui permet d'ajouter ou retirer 20% au TDP défini pour la carte par AMD. 

 

Powertune

Powertune en pratique

 

AMD profite également de Cayman pour proposer un Enhanced Quality Anti-Aliasing. Ce dernier  permet d'accroître indépendamment le nombre de samples (coverage et color) à l'image du CSAA chez nVIDIA (qui l'appelle un peu abusivement AA8X, le MSAA 8x étant nommé 8XQ), ce qui entraine une qualité supérieure pour un coût en terme de performance raisonnable et sans consommer davantage de mémoire vidéo. Le Morphological AA lancé avec BARTS est quant à lui bien sûr  toujours de la partie sur cette nouvelle puce.

 

AA Eq

Enhanced Quality AA

 

La dernière révision d'Eyefinity Display et l'UVD3 se retrouvent également intégrés, comme quoi Cayman apporte son lot de nouveautés par rapport à Cypress, ce qui n'était pas vraiment le cas du GF110 succédant au GF100. Mais la nouveauté c'est bien, l'efficacité c'est mieux, nous verrons dans quelques pages Cayman à l'oeuvre. Finissons cette partie théorique avec le récapitulatif des 2 cartes lancées ce jour : 

 

Récapitulatif 6900

Récapitulatif cartes Cayman

 

Le modèle haut de gamme HD 6970 embarque donc les 1536 unités de calcul, 96 TMU et 32 ROP dans un GPU cadencé à 880 MHz, soit 30 MHz de plus que la HD 5870, de quoi compenser en terme de puissance de calcul brute la perte des 64 ALU. Côté mémoire, 2 Go de GDDR5 à 1375 MHz et bus 256 bits complètent le tout.

 

La HD 6950 est légèrement castrée puisqu'elle n'embarque "plus que" 1408 SP et 88 TMU, les 32 ROP sont par contre toujours là et la fréquence est en berne de 80 MHz. La mémoire perd également 125 MHz mais reste à 2 Go, cette HD 6950 s'annonce bien plus proche de la HD 6970 que ne l'était la HD 5850 de la HD 5870. Passons aux cartes page suivante.



Un poil avant ?

Free boxe la concurrence

Un peu plus tard ...

Mass Effect 3 : sortira ou sortira pas en 2011 ?

Les 230 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !