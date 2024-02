NVIDIA est bien implantée sur le marché des accélérateurs pour les serveurs. En revanche, contrairement à AMD et Intel, qui sont capables de fournir à la fois des CPU et des cGPU (processeurs EPYC et accélérateurs Radeon Instinct chez les rouges ; processeurs Xeon et GPU Max Series du côté des bleus), NVIDIA n’avait pas de solutions CPU jusqu’ici. La situation change avec les processeurs Grace pour serveurs, censés compléter les accélérateurs GPU Hopper. À l’instar des solutions Ampere Altra, les puces de NVIDIA sont sous architecture Arm et représentent donc une alternative aux CPU x86 d’Intel et d’AMD.

GH200 Grace Hopper Superchip © NVIDIA

GH200 : une puce à 72 cœurs

NVIDIA propose différentes déclinaisons de son CPU Grace. L’une est le Grace CPU Superchip. Elle associe deux processeurs Grace comprenant chacun 72 cœurs, soit un total de 144 cœurs (cœurs Arm Neoverse-V2 avec 1 Mo de cache L2 par cœur), et embarque de la mémoire LPPDR5x. Pour cette Superchip, NVIDIA annonce notamment des performances par watt deux fois supérieures à celles des « meilleurs CPU actuels ».

Ce n’est cependant pas cette version du Grace Superchip qui nous intéresse ici, mais plutôt la GH200 Grace Hopper Superchip. Elle combine un GPU H200, une processeur Grace avec 72 cœurs CPU et une grosse quantité de mémoire HBM3e.

Caractéristiques clefs GH200 © NVIDIA

Grâce à diverses caractéristiques - telles que les NVLink ou la plateforme CUDA optimisée pour les CPU Arm - détaillées dans un livre blanc de 39 pages (que vous pouvez consulter en suivant le lien), NVIDIA avance des gains conséquents pour le GH200 comparativement à une solution CPU x86 + GPU Hooper (avec la réserve habituelle qu’il faut avoir pour de telles démonstrations).

© NVIDIA

Les systèmes GH200 sont actuellement en phase de tests. Ils seront plus largement déployés au cours du deuxième trimestre 2024. Nos confrères de Phoronix ont tout de même pu effectuer quelques benchmarks sous Linux (Ubuntu 23.10 avec Linux 6.5) par le biais de GPTshop.ai. Ils ont examiné les performances CPU du GH200 afin de les confronter à celles de processeurs AMD EPYC, Intel Xeon ainsi qu’aux Ampere Altra Max. L’auteur précise que les benchmarks du GPU Hopper feront l'objet d’une autre publication.

Dans l’ensemble, le CPU Grace à 72 cœurs est souvent proche des CPU Xeon Emerald Rapids à 60 cœurs et des puces EPYC Genoa à 64 cœurs ; sur le plan des performances pures, les résultats sont donc plutôt de bon augure pour NVIDIA. Nous mettons quelques résultats ci-dessous, mais n'hésitez pas à consulter la publication de Phoronix ; elle en comprend beaucoup d'autres.

© Phonorix

© Phonorix

© Phonorix

Quid de la conso ?

La principale lacune de la publication a trait aux consommations ; c'est pourtant l’un des arguments mis en avant par NVIDIA. L’auteur explique que la GH200 n’expose pas encore d'interface RAPL / PowerCap / HWMON spécifique au processeur, et qu’il n’a donc pu livrer des mesures fiables pour le moment ; mais qu’il travaille à une solution.

Sans se livrer à des comptes d'apothicaire, rappelons simplement qu'un module Grace CPU Superchip a, selon les valeurs officielles rapportées ci-dessous, un TDP de 500 W avec la mémoire (pour 144 cœurs). Les EPYC à 64 cœurs les plus puissants ont des cTDP compris 320W et 400 W, tandis que les meilleurs Xeon ont des PDT (puissance de dissipation thermique) de 330 W à 385 W. A priori, le CPU de la GH200 serait donc en dessous.

Spécifications Grace Superchip © NVIDIA