COMPTOIR
register

×

Un superchip entre chiplets et mutli-socket ?

Hopper n'arrive pas seul : son heure de Grace est prévue pour l'an prochain !
Un superchip entre chiplets et mutli-socket ?
Grace et Hopper : le combo ultime pour Machine Learner ?
Un peu de grace pour manier vos puces ?

Avec Hopper au tournant, annoncé en grande pompe lors de la keynote de la GPU Techology Conference (GTC), NVIDIA compte bien affirmer haut et fort sa domination sur le segment des centres de calcul. Cependant, la firme ne s’arrête pas là, puisque quelques autres produits ont également été rendus publics : une carte réseau pour relier les DGX-H100 ensemble, une autre, la H100 CNX, rassemblant GPU et fibre optique sur la même carte PCIe afin de retirer le goulot d’étranglement CPU… l’occasion parfaite de recauser d’un projet déjà annoncé : Grace, le CPU Arm haute performance propulsé par le caméléon.

 

Prévu pour l’an prochain sans plus de précision, le bousin a toutefois été largement détaillé au niveau de sa technique par notre tonton Jensen préféré. Avec pas moins de 72 cœurs Armv9 par die et 198 Mio de cache, Grace s’accompagnera de LPDDR5 soudée de part et d’autre du die : un choix qui fait totalement sens d’un point de vue des performances (en plus de rappeler les M1 d’Apple), mais quelque peu étrange dans le choix du type de RAM. En effet, le LP de la LPDDR5 correspond à "Low Power" soit "basse consommation", pas vraiment la caractéristique principale sur un bousin orienté calcul haute performances. Visiblement NVIDIA aurait optimisé au maximum la répartition de la consommation, et a jugé que les 8 puces de mémoires affichant au total 500 Gio/s étaient bien plus efficientes que la DDR5 actuelle.

 

Un superchip entre chiplets et mutli-socket ? [cliquer pour agrandir]

Deux fois plus de fun !

 

Cependant, Grace ne s’arrête pas là et peut, tout comme le M1 Max de chez Apple, être combinée par 2 (pas plus, par contre) afin de former un CPU Superchip de 144 cœurs maximum, assemblage qui ne risque justement pas d’être… super cheap. Mais trêve de plaisanterie : le conglomérat sera relié par un interconnect cohérent — nous supposons ici "cache-cohérent", c’est-à-dire permettant de transporter directement les données entre niveau de cache des deux SoC, sans passer par des coûteux accès mémoires — nommé NVLINK C2C (Chip-to-Chip) offrant la bagatelle de 900 Gio/s, soit 7 fois le débit du PCIe 5.0, pourtant tout neuf ! Un chiffre d’autant plus impressionnant que les visuels ne font apparaître ni interposer ni die enfouis dans le substrat à la manière de l’EMIB de chez Intel : tout semble passer directement par les pistes du PCB : jolie prouesse. Au niveau du TDP, l’ensemble demeure raisonnable avec 500 W, comprenant les deux CPU et la RAM : l’influence de la LPDDR ?

 

Grace et Hopper : le combo ultime pour Machine Learner ? [cliquer pour agrandir]

 

Une version Grace Hopper (quelle surprise, vu les noms, personne ne s’en serait douté…) du Superchip est également au programme, troquant simplement le second Grace par un GH100 tout en conservant la bande passant faramineuse de 900 Gio/s histoire de bien mettre en commun les données à traiter. En cas de besoin, Grace est également configurable pour contrôler jusqu’à 8 GPU Hopper par Superchip, à condition des les jumeler avec un contrôleur réseau Mazda CX7 : de quoi faire rêver les amateurs de machine learning, avec une configuration qui n’est pas sans rappeler les mobales blindées de slots PCIe à destination des mineurs. Enfin, notez la présence sous un PCB unique de deux Hopper pour une Grace, une solution potentiellement avantageuse pour accélérer ses calculs dans un format "réduit" tout en faisant usage des toutes dernières technologies des verts.

 

Un peu de grace pour manier vos puces ? [cliquer pour agrandir]

Pas de souci, il y en a pour tous les goûts !

 

Au niveau des performances, le secret est encore total ; ce qui est plutôt logique vu la date de sortie estimée du produit. NVIDIA communique uniquement sur un score estimé de 740 points sur SPECCrate2017_int_base pour le Superchip superchargé aux superCPUs, soit environ 1,5 x ce que les deux EPYC 7742 (Zen 2) de 64 cœurs chacun offrent sur les DGX-A100 actuelles. De quoi se frotter les mains, mais également se méfier légèrement : le calcul entier n’est pas franchement la première chose imaginée sur ce type de serveur, il paraît étrange de le mettre en avant… Mais, avec une carte graphique à côté bien plus performante sur les flottants, le choix se justifie : direction 2023 pour en découvrir davantage en situation réelle !

 

Un poil avant ?

LAPSUS$ : 2 nouvelles victimes confirmées et une analyse par Microsoft

Un peu plus tard ...

Le FSR 2 livre beaucoup plus de détails

Les 7 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par JoeBar, le Vendredi 01 Avril 2022 à 09h07  
Moi Grace, ça me fait penser de suite à ça
par Un adepte de Godwin en Provence-Alpes-Côte d'Azur, le Vendredi 25 Mars 2022 à 16h01  
par Jemporte le Jeudi 24 Mars 2022 à 13h33
En quittant x86, Apple s'est trouvé un nouveau concurrent niveau hardware, et je parie que sur le coup, il est largué,
Cela m'étonnerai , peut être en GPU , mais en CPU , NVidia est super loin derrière un M1
par Ragol embusqué, le Vendredi 25 Mars 2022 à 08h59  
par jumorolo le Jeudi 24 Mars 2022 à 13h53
pourquoi faire ? le marché ciblé n'est pas du tout le même
Pour voir l'efficacité des archis selon nvidia et apple, les deux ayant fait des systemes arm/gpu et les deux étant sur des noeuds de gravure proches (4nm/5nm)
Donc si on cale les deux à 100W par exemple on pourrait se faire une idée.
Et surtout, ça serait FUN!!
par dfd, le Jeudi 24 Mars 2022 à 17h55  
Contrôleur de réseau Mazda ?
Moi, je marche à la Wonder...
par jumorolo, le Jeudi 24 Mars 2022 à 13h53  
par ragol embusqué le Jeudi 24 Mars 2022 à 12h06
grace hooper vs m1 ultra en consommation égale juste pour voir
pourquoi faire ? le marché ciblé n'est pas du tout le même
par Jemporte, le Jeudi 24 Mars 2022 à 13h33  
En quittant x86, Apple s'est trouvé un nouveau concurrent niveau hardware, et je parie que sur le coup, il est largué, ce qui est normal car niveau prix il devrait l'être aussi. Le chip double complet devrait avoisiner les 40 mille euros (en prenant pour base le prix du A100, soit les futur prix du H100).
Donc un Nvidia Studio complet serait vendu à près de 50 000 euros.
par ragol embusqué, le Jeudi 24 Mars 2022 à 12h06  
grace hooper vs m1 ultra en consommation égale juste pour voir