COMPTOIR
  
register

×
×
×

Hopper n'arrive pas seul : son heure de Grace est prévue pour l'an prochain !
Un superchip entre chiplets et mutli-socket ?
Grace et Hopper : le combo ultime pour Machine Learner ?
Un peu de grace pour manier vos puces ?

Avec Hopper au tournant, annoncé en grande pompe lors de la keynote de la GPU Techology Conference (GTC), NVIDIA compte bien affirmer haut et fort sa domination sur le segment des centres de calcul. Cependant, la firme ne s’arrête pas là, puisque quelques autres produits ont également été rendus publics : une carte réseau pour relier les DGX-H100 ensemble, une autre, la H100 CNX, rassemblant GPU et fibre optique sur la même carte PCIe afin de retirer le goulot d’étranglement CPU… l’occasion parfaite de recauser d’un projet déjà annoncé : Grace, le CPU Arm haute performance propulsé par le caméléon.

 

Prévu pour l’an prochain sans plus de précision, le bousin a toutefois été largement détaillé au niveau de sa technique par notre tonton Jensen préféré. Avec pas moins de 72 cœurs Armv9 par die et 198 Mio de cache, Grace s’accompagnera de LPDDR5 soudée de part et d’autre du die : un choix qui fait totalement sens d’un point de vue des performances (en plus de rappeler les M1 d’Apple), mais quelque peu étrange dans le choix du type de RAM. En effet, le LP de la LPDDR5 correspond à "Low Power" soit "basse consommation", pas vraiment la caractéristique principale sur un bousin orienté calcul haute performances. Visiblement NVIDIA aurait optimisé au maximum la répartition de la consommation, et a jugé que les 8 puces de mémoires affichant au total 500 Gio/s étaient bien plus efficientes que la DDR5 actuelle.

 

Un superchip entre chiplets et mutli-socket ? [cliquer pour agrandir]

Deux fois plus de fun !

 

Cependant, Grace ne s’arrête pas là et peut, tout comme le M1 Max de chez Apple, être combinée par 2 (pas plus, par contre) afin de former un CPU Superchip de 144 cœurs maximum, assemblage qui ne risque justement pas d’être… super cheap. Mais trêve de plaisanterie : le conglomérat sera relié par un interconnect cohérent — nous supposons ici "cache-cohérent", c’est-à-dire permettant de transporter directement les données entre niveau de cache des deux SoC, sans passer par des coûteux accès mémoires — nommé NVLINK C2C (Chip-to-Chip) offrant la bagatelle de 900 Gio/s, soit 7 fois le débit du PCIe 5.0, pourtant tout neuf ! Un chiffre d’autant plus impressionnant que les visuels ne font apparaître ni interposer ni die enfouis dans le substrat à la manière de l’EMIB de chez Intel : tout semble passer directement par les pistes du PCB : jolie prouesse. Au niveau du TDP, l’ensemble demeure raisonnable avec 500 W, comprenant les deux CPU et la RAM : l’influence de la LPDDR ?

 

Grace et Hopper : le combo ultime pour Machine Learner ? [cliquer pour agrandir]

 

Une version Grace Hopper (quelle surprise, vu les noms, personne ne s’en serait douté…) du Superchip est également au programme, troquant simplement le second Grace par un GH100 tout en conservant la bande passant faramineuse de 900 Gio/s histoire de bien mettre en commun les données à traiter. En cas de besoin, Grace est également configurable pour contrôler jusqu’à 8 GPU Hopper par Superchip, à condition des les jumeler avec un contrôleur réseau Mazda CX7 : de quoi faire rêver les amateurs de machine learning, avec une configuration qui n’est pas sans rappeler les mobales blindées de slots PCIe à destination des mineurs. Enfin, notez la présence sous un PCB unique de deux Hopper pour une Grace, une solution potentiellement avantageuse pour accélérer ses calculs dans un format "réduit" tout en faisant usage des toutes dernières technologies des verts.

 

Un peu de grace pour manier vos puces ? [cliquer pour agrandir]

Pas de souci, il y en a pour tous les goûts !

 

Au niveau des performances, le secret est encore total ; ce qui est plutôt logique vu la date de sortie estimée du produit. NVIDIA communique uniquement sur un score estimé de 740 points sur SPECCrate2017_int_base pour le Superchip superchargé aux superCPUs, soit environ 1,5 x ce que les deux EPYC 7742 (Zen 2) de 64 cœurs chacun offrent sur les DGX-A100 actuelles. De quoi se frotter les mains, mais également se méfier légèrement : le calcul entier n’est pas franchement la première chose imaginée sur ce type de serveur, il paraît étrange de le mettre en avant… Mais, avec une carte graphique à côté bien plus performante sur les flottants, le choix se justifie : direction 2023 pour en découvrir davantage en situation réelle !

 

Un poil avant ?

LAPSUS$ : 2 nouvelles victimes confirmées et une analyse par Microsoft

Un peu plus tard ...

Le FSR 2 livre beaucoup plus de détails

Les 7 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !