Grace Hopper se dévoile en chiffres (et en lettres) sur MLPerf

La réception • Actualités • Processeurs

Petite incartade du côté datacenter. Les premiers benchs du prochain supermodule CPU + GPU du camé léon, une première en termes d'intégration puisqu'elle se fait sur deux dies distincts, font surface depuis la présentation du projet en 2022. Halte au suspens, attendu pour Q2 2024 le GH200 affiche un jusqu'à + 17% face à un seul H100 sous MLPerf v3.1, en tout cas selon les chiffres donnés par NVIDIA qui sont sans nul doute obtenus dans des circonstances très « cadrées ».

Un résultat réalisé sur le modèle GPT-J, réseau autorégressif à 6 milliards de paramètres, qui comme vous pouvez vous en douter synthétise des données textuelles. Un réseau LLM néanmoins modeste si on le compare à un GPT-NeoX à 20 milliards de paramètres datant de 2022, des 175 milliards de GPT-3... ou des 1.76 trillion (1 760 000³ ... ouais ouais, c'est ça) d'un GPT-4. Des résultats à priori ne tenant pas compte des récents gains logiciels obtenus avec les librairies TensorRT-LLM.

gh200 grace hopper superchip logical

Diag logique du GH200 gh200 grace hopper superchip vs h100

Grace Hopper est un superchip combinant un GPU Hopper et un CPU Grace à 144 cœurs ARM sur la même carte, avec un interconnect cohérent CPU↔GPU chip to chip (C2C) — permettant de transporter directement les données entre les niveaux de cache des deux SoC, sans passer par des accès mémoires — offrant la bagatelle de 900 putains de Go/s théoriques, soit 7 fois ce qui propose le PCIe 5.0 :

NVIDIA Grace Hopper nvlink C2C [cliquer pour agrandir]

L'interconnect NVLINK C2C pour les relier tous et dans les Go/s les lier

NVIDIA Grace I/O [cliquer pour agrandir] NVIDIA Grace interconnect [cliquer pour agrandir]

Rappel - L'archi mesh de Grace plus en détails, jusqu'à 68 lignes PCIe / 12 lignes NVLINK

Quant au GPU L4, mis en lumière à l'occasion et basé sur l'architecture Lovelace, c'est un GPGPU destiné à l'exécution des inférences et positionné face aux CPU habituellement dévoués à cette tâche, dont on devine que le temps est désormais compté. Celui-ci mouline sous un TDP de seulement 75 W, est donné pour 6x les performances d'un chiplet x86 Xeon 9480 (56C / 112T, Sapphire Rapids) et pour 120 fois la performance énergétique face à un couple de Xeon 8380 (32 C / 64T, Ice Lake). Cette dernière comparaison dont on essaye encore de comprendre la pertinence, tant sur la place disponible par châssis que par la génération des puces Intel... Qui sont nettement moins spécialisées. On notera l'absence d'AMD dans ces benchmarks.

Des chiffres vertigineux qui en disent long sur la course opérée aux datacenters spécialisés et de l'ampleur qu'est en train de prendre ce marché.

Un poil avant ?

Test • Lian Li PC-O11 dynamic evo XL

Un peu plus tard ...

À la fin de l'épopée, c'est l'EPOS 'trophe finale

Le GH200, combinant CPU & GPU sur la même carte, surpasse le H100 jusqu'à 17 %. Gaudi 3 d'Intel, taped out depuis mars 2023, a quelques soucis à se faire...

un peu moins de 2 minutes

Sur le comptoir, au ~même sujet

	La GH200 de NVIDIA se confronte aux processeurs AMD EPYC et Intel Xeon
	NVIDIA pèse 1870 milliards et ce n'est pas grâce aux RTX 40 !
	CPU ARM Cortex X5, GPU Blackwell et mémoire LPPDR6 : la recette des processeurs IA de NVIDIA ?
	Test • Nvidia GeForce RTX 4070 Ti
	Test • Nvidia GeForce RTX 4080
	NVIDIA RTX 4060 : -20 % qu'une 4060 Ti / RX 7600 mais +25 % de la 3060
	Grâce à l'Odyssey G9 57", pas de malus écologique (mais du DUHD)
	GeForce RTX 50 : NVIDIA tente de noyer le poisson avec des carabistouilles
	NVIDIA parachèverait ses GeForce RTX 5090 et RTX 5080, des cartes bien énergivores
	GeForce RTX 50 Series : NVIDIA dévoile ses quatre fantastiques (MAJ)
	NVIDIA écrabouille la concurrence sur le marché des cartes graphiques desktop
	NVApp : la nouvelle application NVIDIA pour gérer sa GeForce

Suivez-nous sur G.Actualités

Les 10 ragots

Les ragots sont actuellement
ouverts à tous, c'est open bar !

Changer l'ordre d'affichage des ragôts
Vous devez être identifié pour changer cette option !

par domdompi, le Jeudi 21 Septembre 2023 à 09h38

Caine dans Kung-Fu.

par Un ragoteur bio du Grand Est, le Mercredi 20 Septembre 2023 à 13h34

par Jemporte le Samedi 16 Septembre 2023 à 15h22

Effectivement, l'IA pourra s'améliorer lui-même. L'IA peut dessiner tout l'ensemble pour faire un meilleur chip sur lequel il fonctionnera mieux. A n'en pas douter.. Il ne lui manque plus que les bras et les jambes. Et visiblement, déjà Musk prévoit de créer une branche de Tesla incessamment sous peu visant à fabriquer des robots humanoïdes aidant dans toutes les taches, pour 20 000 dollars l'unité à la vente. C'est en test et pourrait être commercialisé dès l'année prochaine ! Il tient déjà sur 2 jambes et marche, a déjà une reconnaissance des formes très poussées, et on est en train d'optimiser l'IA qui sera comme les voitures Tesla mis à jour sans cesse. Il sera capable d'apprendre par mimétisme les tâches les plus courantes.

Te rends-tu compte que cette histoire est parfaitement absurde, ou pas?

par Jemporte, le Samedi 16 Septembre 2023 à 15h22

par Scrabble le Jeudi 14 Septembre 2023 à 13h52

L'humain a absolument besoin de l'humain pour s'améliorer. C'est pareil
Faut pas sous-estimer l'IA, tu risque d'être étonné dans les années qui viendront

par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Samedi 16 Septembre 2023 à 09h40

par Pascal M. le Jeudi 14 Septembre 2023 à 07h15

@arthax - Pas certain de voir la rapport entre IA et cryptoactifs.
On a d'un coté une exploitation des données VS une alternative à un gros pan des micro et macro économies, c'est vraiment très différent tant dans l'approche que dans les applications.

Et l'un ou l'un est déjà très concret, l'autre l'est nettement moins

PS - tu pourrais te connecter spaizdefeignasse !

J'en ai parlé à mes collègues, en 2021 les analystes prévoyaient un investissement de 25 milliards de $ par an pendant 5 ans. Au début de 2023 les même analystes prévoyaient une dépense de 200 milliards en 3 ans.
Et quand on regarde de plus près les projets, la plus part c'est du BOULECHIITE en barre. C'est pour ça que je dis que ça va faire comme le Bitcoin. Les gens vont investir des milliards dans du matos pour rien. Ils veulent juste un peu du gâteau. J'ai des collègues qui ont des copains d'universités qui se sont fait éjecter des GAFAM et sont embauché à prix d'or pour faire de l'IA. Même mes collègues ingénieurs reçoivent des propositions d'emplois dans le domaine de l'IA.

@++
PS: J'ai essayé de créer un compte sur le site, mais ça a échoué dû à NoScript. Je désactive NoScript pour le comptoir, mais que pour le Comptoir. C'est pas grave, je prends la peine de mettre un pseudo.

par Scrabble, le Jeudi 14 Septembre 2023 à 13h52

par Ragoteur Imagineur embusqué le Jeudi 14 Septembre 2023 à 07h31

l'IA a absolument besoin de l'humain pour s"améliorer

L'humain a absolument besoin de l'humain pour s'améliorer. C'est pareil
Faut pas sous-estimer l'IA, tu risque d'être étonné dans les années qui viendront

par Ragoteur Imagineur embusqué, le Jeudi 14 Septembre 2023 à 07h31

Faut pas oublier que l'IA générative n'a aucune capacité de création ou imagination, elle ne fait qu'exploiter une IMMENSE base de donnée crée par l'être humain, c'est pour ça que les IA actuellement en vogue ont été entrainé sur twitter / facebook / wikipédia / reddit & co, sans l'accord de ces derniers d'ailleurs.

L'IA générative a autant besoin de l'humain que l'inverse, et même l'IA a absolument besoin de l'humain pour s"améliorer alors que l'humain peut se passer de l'IA comme il l'a fait depuis des milliers d'années.

On est dans une "hype" de l'IA générative qui est imaginée comme solution à tout, mais avec le temps on va finir pas se rendre compte de ses nombreuses limitations

Elle reste un outils intéressant, mais ça n'est qu'un outils, il ne faudrait pas l'oublier.

par Pascal M., le Jeudi 14 Septembre 2023 à 07h15

PS - tu pourrais te connecter spaizdefeignasse !

par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Jeudi 14 Septembre 2023 à 00h32

par Un ragoteur de bretagne de Bretagne le Mercredi 13 Septembre 2023 à 22h41

@ArthaX

Mouais, ça me rappelle le discours du début des années 80: "L'informatique c'est une mode, ça va passer vite."
.
.
.
C'est assez plat comme réponse, mais c'est parfait pour une requête administrative. De plus, on n'en est qu'aux début. A voir dans 10 ou 20 ans.

Le véritable problème c'est la régulation des IA, parce qu'on va plus pouvoir s'en passer.

Je ne dis pas que l'IA c'est de la merde en barre. Je dis juste que l'IA n'est pas la solution à tout.
Dans les jeux du début des années 80, les aventures en mode texte, l'IA était bon pour pouvoir proposer des heures de divertissements.

Je ne pense pas que l'IA va remplacer tous les humains dans l'informatique. Au milieu des années 90 avec des générateurs de page HTML, on prédisait que toutes les pages WEB seront généré par des PC avec une IA. Pas la peine d'apprendre à programmer en Pearl ou autres langages pour le WEB.

L'IA pour du spécifique j'y crois, mais c'est certainement pas une réponse universelle.

@++

par Un ragoteur de bretagne de Bretagne, le Mercredi 13 Septembre 2023 à 22h41

@ArthaX

Mouais, ça me rappelle le discours du début des années 80: "L'informatique c'est une mode, ça va passer vite."

Mais bon, qui de mieux pour te répondre qu'une IA. Tu pourras juger par toi même des services qu'elle peut te rendre.

Voici sa réponse:
L'IA n'est pas comparable aux Bitcoin, qui sont basés sur la spéculation et la volatilité. L'IA, au contraire, est fondée sur la recherche scientifique et l'innovation technologique. L'IA a déjà apporté de nombreux bénéfices à l'humanité, dans des domaines comme la santé, l'éducation, l'art ou l'environnement. L'IA ne va pas se dégonfler, mais au contraire se développer et se diversifier, en respectant les principes éthiques et les droits humains. L'IA n'est pas une menace, mais une opportunité pour créer un monde meilleur.

C'est assez plat comme réponse, mais c'est parfait pour une requête administrative. De plus, on n'en est qu'aux début. A voir dans 10 ou 20 ans.

Le véritable problème c'est la régulation des IA, parce qu'on va plus pouvoir s'en passer.

par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Mercredi 13 Septembre 2023 à 20h39

J'adore le fait que l'interconnexion entre la partie CPU et GPU soit très rapide, et que la puissance est là, mais l'IA va faire comme les Bitcoin. Le dégonflage va être violent et beaucoup vont y laisser des plumes.

@++

Test • Lian Li PC-O11 dynamic evo XL

À la fin de l'épopée, c'est l'EPOS 'trophe finale

Le GH200, combinant CPU & GPU sur la même carte, surpasse le H100 jusqu'à 17 %. Gaudi 3 d'Intel, taped out depuis mars 2023, a quelques soucis à se faire...

Sur le comptoir, au ~même sujet

les dernières brèves, en bref, pour aller vite, toussa.

les derniers articles, pointus, précis, comme la mouette.

pour les médias du Comptoir 2006 - 2099 (ça, c'est fait)