Huawei CloudMatrix 384 : plus fort que le NVIDIA GB200 NVL72 ? |
————— 16 Avril 2025 à 18h10 —— 19369 vues
Huawei CloudMatrix 384 : plus fort que le NVIDIA GB200 NVL72 ? |
————— 16 Avril 2025 à 18h10 —— 19369 vues
Huawei a récemment officialisé ses clusters CloudMatrix 384, reposant sur des puces Ascend 910C (7 nm). Présentés comme une alternative crédible aux GB200 NVL72 de NVIDIA, ces clusters sont déjà déployés à grande échelle dans le centre de données de Wuhu. Le site SemiAnalysis a publié une analyse approfondie à ce sujet. Il revient sur l’allégation d’une puissance de calcul de 300 pétaflops BF16, laquelle dépasse les 180 pétaflops délivrés par le système NVL72 de NVIDIA.
© Huawei
Pris individuellement, les accélérateurs Ascend 910C de Huawei peinent à rivaliser avec les GPU GB200 Blackwell de NVIDIA. Ces derniers offrent des performances BF16 trois fois supérieures (2 500 TFLOPS contre 780 TFLOPS), davantage de mémoire HBM (192 Go contre 128 Go) et une bande passante nettement plus élevée (8 To/s contre 3,2 To/s).
© SemiAnalysis
Mais à l’échelle du système, le rapport de force s’inverse. Le cluster CloudMatrix 384 de Huawei — composé, comme son nom l’indique, de 384 accélérateurs — revendique 1,7 fois plus de puissance de calcul (en BF16), une capacité HBM totale 3,6 fois supérieure, et prend donc en charge plus de cinq fois le nombre de GPU que le NVL72 de NVIDIA.
© Huawei
Nulle magie ou parfaite synergie. Cette supériorité brute n’est en effet pas sans contrepartie : le CloudMatrix 384 affiche une consommation électrique près de quatre fois plus élevée que celle du NVL72 (560 kW contre 145 kW). SemiAnalysis rappelle toutefois que cette dépense énergétique constitue un frein bien moindre en Chine qu’aux États-Unis — abstraction faite de la prédominance du charbon dans le mix énergétique. À ce propos, dans le dossier que nous avions consacré à la transformation des fermes de minage GPU en centres de données IA, l’appétence pour les sites étaient déjà dictée par de telles considérations.
© SemiAnalysis
En résumé, SemiAnalysis estime que Huawei accuse une génération de retard sur les performances des puces par rapport à AMD et NVIDIA, mais en a une d’avance sur la conception et le déploiement de tels systèmes à grande échelle. Par contre, la publication ne dit rien sur les solutions de refroidissement nécessaires à de telles infrastructures. Un point soulevé par le DigiTimes mais pour lequel nous n’avons rien trouvé de très concluant.