COMPTOIR
register

Huawei CloudMatrix 384 : plus fort que le NVIDIA GB200 NVL72 ?

Huawei a récemment officialisé ses clusters CloudMatrix 384, reposant sur des puces Ascend 910C (7 nm). Présentés comme une alternative crédible aux GB200 NVL72 de NVIDIA, ces clusters sont déjà déployés à grande échelle dans le centre de données de Wuhu. Le site SemiAnalysis a publié une analyse approfondie à ce sujet. Il revient sur l’allégation d’une puissance de calcul de 300 pétaflops BF16, laquelle dépasse les 180 pétaflops délivrés par le système NVL72 de NVIDIA.

cloudmatric 384

© Huawei

Une histoire de puissance

Pris individuellement, les accélérateurs Ascend 910C de Huawei peinent à rivaliser avec les GPU GB200 Blackwell de NVIDIA. Ces derniers offrent des performances BF16 trois fois supérieures (2 500 TFLOPS contre 780 TFLOPS), davantage de mémoire HBM (192 Go contre 128 Go) et une bande passante nettement plus élevée (8 To/s contre 3,2 To/s).

ascend 910c cloud matric 384 vs nvidia gb200 nvl72 semianalysis

© SemiAnalysis

Mais à l’échelle du système, le rapport de force s’inverse. Le cluster CloudMatrix 384 de Huawei — composé, comme son nom l’indique, de 384 accélérateurs — revendique 1,7 fois plus de puissance de calcul (en BF16), une capacité HBM totale 3,6 fois supérieure, et prend donc en charge plus de cinq fois le nombre de GPU que le NVL72 de NVIDIA.

cloudmatric 384 perf

© Huawei

Nulle magie ou parfaite synergie. Cette supériorité brute n’est en effet pas sans contrepartie : le CloudMatrix 384 affiche une consommation électrique près de quatre fois plus élevée que celle du NVL72 (560 kW contre 145 kW). SemiAnalysis rappelle toutefois que cette dépense énergétique constitue un frein bien moindre en Chine qu’aux États-Unis — abstraction faite de la prédominance du charbon dans le mix énergétique. À ce propos, dans le dossier que nous avions consacré à la transformation des fermes de minage GPU en centres de données IA, l’appétence pour les sites étaient déjà dictée par de telles considérations.

ascend 910c cloud matric 384 vs nvidia gb200 nvl72 semianalysis production

© SemiAnalysis

En résumé, SemiAnalysis estime que Huawei accuse une génération de retard sur les performances des puces par rapport à AMD et NVIDIA, mais en a une d’avance sur la conception et le déploiement de tels systèmes à grande échelle. Par contre, la publication ne dit rien sur les solutions de refroidissement nécessaires à de telles infrastructures. Un point soulevé par le DigiTimes mais pour lequel nous n’avons rien trouvé de très concluant.

Un poil avant ?

Sharkoon se met aux ventirads et dégaine d'emblée trois modèles

Un peu plus tard ...

Avec Amuse 3.0, les Ryzen et Radeon passent la seconde sur le chemin de l'IA générative

Les 2 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !