Huawei CloudMatrix 384 : plus fort que le NVIDIA GB200 NVL72 ?

La réception • Actualités • IA & VR

Huawei a récemment officialisé ses clusters CloudMatrix 384, reposant sur des puces Ascend 910C (7 nm). Présentés comme une alternative crédible aux GB200 NVL72 de NVIDIA, ces clusters sont déjà déployés à grande échelle dans le centre de données de Wuhu. Le site SemiAnalysis a publié une analyse approfondie à ce sujet. Il revient sur l’allégation d’une puissance de calcul de 300 pétaflops BF16, laquelle dépasse les 180 pétaflops délivrés par le système NVL72 de NVIDIA.

cloudmatric 384

© Huawei

Une histoire de puissance

Pris individuellement, les accélérateurs Ascend 910C de Huawei peinent à rivaliser avec les GPU GB200 Blackwell de NVIDIA. Ces derniers offrent des performances BF16 trois fois supérieures (2 500 TFLOPS contre 780 TFLOPS), davantage de mémoire HBM (192 Go contre 128 Go) et une bande passante nettement plus élevée (8 To/s contre 3,2 To/s).

ascend 910c cloud matric 384 vs nvidia gb200 nvl72 semianalysis

© SemiAnalysis

Mais à l’échelle du système, le rapport de force s’inverse. Le cluster CloudMatrix 384 de Huawei — composé, comme son nom l’indique, de 384 accélérateurs — revendique 1,7 fois plus de puissance de calcul (en BF16), une capacité HBM totale 3,6 fois supérieure, et prend donc en charge plus de cinq fois le nombre de GPU que le NVL72 de NVIDIA.

cloudmatric 384 perf

© Huawei

Nulle magie ou parfaite synergie. Cette supériorité brute n’est en effet pas sans contrepartie : le CloudMatrix 384 affiche une consommation électrique près de quatre fois plus élevée que celle du NVL72 (560 kW contre 145 kW). SemiAnalysis rappelle toutefois que cette dépense énergétique constitue un frein bien moindre en Chine qu’aux États-Unis — abstraction faite de la prédominance du charbon dans le mix énergétique. À ce propos, dans le dossier que nous avions consacré à la transformation des fermes de minage GPU en centres de données IA, l’appétence pour les sites étaient déjà dictée par de telles considérations.

ascend 910c cloud matric 384 vs nvidia gb200 nvl72 semianalysis production

© SemiAnalysis

En résumé, SemiAnalysis estime que Huawei accuse une génération de retard sur les performances des puces par rapport à AMD et NVIDIA, mais en a une d’avance sur la conception et le déploiement de tels systèmes à grande échelle. Par contre, la publication ne dit rien sur les solutions de refroidissement nécessaires à de telles infrastructures. Un point soulevé par le DigiTimes mais pour lequel nous n’avons rien trouvé de très concluant.

Un poil avant ?

Sharkoon se met aux ventirads et dégaine d'emblée trois modèles

Un peu plus tard ...

Avec Amuse 3.0, les Ryzen et Radeon passent la seconde sur le chemin de l'IA générative

Des puces moins performantes individuellement, mais une puissance totale supérieure.

1 minute et demi

Sur le comptoir, au ~même sujet

	Test • Nvidia GeForce RTX 4070 Ti
	Test • Nvidia GeForce RTX 4080
	NVIDIA RTX 4060 : -20 % qu'une 4060 Ti / RX 7600 mais +25 % de la 3060
	GeForce RTX 50 : NVIDIA tente de noyer le poisson avec des carabistouilles
	NVIDIA parachèverait ses GeForce RTX 5090 et RTX 5080, des cartes bien énergivores
	GeForce RTX 50 Series : NVIDIA dévoile ses quatre fantastiques (MAJ)
	NVApp : la nouvelle application NVIDIA pour gérer sa GeForce
	NVIDIA écrabouille la concurrence sur le marché des cartes graphiques desktop
	La face de L'ACE (feat. NVIDIA + IA)
	NVIDIA va bien, et va bien aller. D'après vous, pourquoi ?
	IA : Groq et ses LPU pourraient bien venir gâcher la fête de NVIDIA et autres vendeurs de GPU
	NVIDIA incrimine les CPU Raptor Lake d'Intel pour les instabilités dans les jeux

Suivez-nous sur G.Actualités

Les 2 ragots

Les ragots sont actuellement
ouverts à tous, c'est open bar !

Changer l'ordre d'affichage des ragôts
Vous devez être identifié pour changer cette option !

par Rémi B., le Jeudi 17 Avril à 11h18

par Un ragoteur de transit d'Occitanie le Mercredi 16 Avril à 18h50

L'autre point pas soulevé, c'est que la puce n'est à priori pas fabriquée en Chine avec SMIC mais à Taïwan chez TSMC.
Même en imaginant que Huaweï ai réussi à constituer un stock conséquent, si l'oncle Sam passe dans le coin pour resserrer la vis, il est possible que la pénurie guette rapidement.

Vous avez raison ; mais c'est brièvement abordé dans l'article. Le wafer principal est effectivement fabriqué par TSMC, tandis que la HBM vient de Corée du Sud. SemiAnalysis précise qu'en principe, SMIC pourrait fabriquer une telle puce, sans doute avec quelques concessions. Théoriquement, SMIC est descendu au 7nm depuis plusieurs mois. Les rendements seraient toutefois pas excellents.

par Un ragoteur de transit d'Occitanie, le Mercredi 16 Avril à 18h50

Une histoire de puissance

Sharkoon se met aux ventirads et dégaine d'emblée trois modèles

Avec Amuse 3.0, les Ryzen et Radeon passent la seconde sur le chemin de l'IA générative

Des puces moins performantes individuellement, mais une puissance totale supérieure.

Sur le comptoir, au ~même sujet

les dernières brèves, en bref, pour aller vite, toussa.

les derniers articles, pointus, précis, comme la mouette.

pour les médias du Comptoir 2006 - 2099 (ça, c'est fait)