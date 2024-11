NVIDIA a profité de la SC24 pour présenter deux nouvelles plateformes matérielles pour les serveurs. Elles exploitent chacune une architecture différente : la H200 NVL mobilise des GPU Hopper, alors que la GB200 NVL4 profite de ceux de la dernière génération, Blackwell.

GB200 NVL4 exposé à la Supercomputing 2024 © ServeTheHome

H200 NVL : Hopper délayé à la sauce PCIe

La H200 NVL agglomère jusqu’à quatre GPU H200 via un domaine NVLINK (garant d’une bande passante GPU à GPU sept fois plus élevée que le PCIe 5.0 standard ; 900 Go vs 128 Go). NVIDIA souligne que selon une étude récente, environ 70 % des racks d'entreprise ont une puissance de 20 kW ou moins et utilisent un système de refroidissement par air. Qu’en conséquence, les GPU PCIe restent essentiels pour répondre à cette demande.

La société affirme que les solutions H200 NVL peuvent s'intégrer dans n'importe quel centre de données et offrir une gamme de configurations de serveurs flexibles et optimisées pour les charges de travail HPC et IA hybrides. Le NVIDIA H200 NVL est couvert par un abonnement de cinq ans à NVIDIA AI Enterprise.

Deux fois plus de Blackwell

Passons à Blackwell. Tandis que la GB200 Grace Blackwell Superchip (NVL2) combine deux GPU Blackwell et un CPU Arm Grace, le module GB200 NVL4 double cette quantité : il embarque 4 GPU et deux CPU Grace. L’ensemble dispose de 768 Go de mémoire HBM3.

La consommation d'énergie du système est de 5 400 watts (le double des 2 700 watts nécessaires au modèle GB200 NVL2, son petit frère doté de deux GPU). Comme l’estime notre confrère de ServeTheHome, la puissance globale devrait être légèrement supérieure à 6 kW dans un serveur en comptant les autres composants.

Rappelons que NVIDIA propose aussi des GB200 NVL72 qui, comme leur numéro l’indique, regroupent 36 CPU Grace et 72 GPU Blackwell au sein d'une configuration rackable engloutissant 120 kW. À ce propos, un récent rappport publié par The Information fait état de problèmes de surchauffe. NVIDIA aurait été contrainte de repenser la conception de ses racks à plusieurs reprises, au grand dam de ses clients, confrontés à des retards de déploiement.

Pour en revenir aux plus modestes plateformes NVL4 GB200, elles doivent être livrées à partir du second semestre 2025 d'après ServeTheHome.