À chacun ses manques : les data centers souffrent d'une penurie d'A100

La réception • Actualités • Cartes graphiques

Présenté en mai, l'A100 est l’énorme GPU — le plus gros d'ailleurs, et plus c'est gros, plus il est difficile d'obtenir un bon rendement — Ampere à tout faire de Nvidia pour les professionnels, une puce qui vise un marché d'autant plus large que le GPU supporte de nombreuses instructions et existe depuis peu aussi avec une capacité de HBM2 doublée à 80 Go par rapport à l'original, ainsi que dans un format carte PCIe 4.0. Apparemment, la demande serait très forte du côté des data centers, le monde de la science et le domaine du High Performance Computing, au point où le Vice President of Accelerated Computing Business Unit de Nvidia, Ian Buck, a admis qu'il faudra probablement plusieurs mois pour permettre à sa compagnie honorer son carnet de commandes et rattraper la demande !

Sans surprise, en bon porte-parole de son église et en écho à son grand patron, Ian Buck explique que ce succès est dû à la forte croissance des activités d’entraînement et d'inférence en IA, et comme leur architecture change évidemment la donne « comme à chaque fois » et que l'A100 est 20 fois plus performant que le prédécesseur V100, l’intérêt pour leurs produits a explosé, tout simplement ! Dur d'être trop bon, hein ? Pffiou.

nvidia a100 [cliquer pour agrandir]

En quoi est-ce que ça nous concerne ? Les difficultés de produire suffisamment d'A100 ne sont évidemment pas directement liées à celles des RTX 3000, ces dernières sont conçues à partir du procédé 8 nm de Samsung, mais l'A100 est fabriqué chez TSMC sur son 7 nm. Et on sait très bien que le 7 nm est l'un des procédés les plus populaires en ce moment, utilisé pour la production en masse de nombreuses puces, notamment chez AMD qui en a besoin pour ses processeurs, ses GPU et les SoC pour les consoles next-gen !

À partir des propos d'Ian Buck, on peut donc aisément imaginer la situation tendue (mais ô combien profitable) chez TSMC et qu'il faudra effectivement plusieurs mois avant d’espérer voir un début de normalisation, certainement aussi en fonction de la taille du machin à fabriquer — un A100 fait tout de même 826 mm² avec 54,2 milliards de transistors, Navi 21 affiche « seulement » 520 mm² et 26,8 milliards. Bien entendu, d'autres aspects sont à prendre un compte, avec un GPU et un CPU viennent aussi toute une myriade d'autres puces importantes, et qui peuvent aussi souffrir d'une production désormais insuffisante face à la demande croissante.

En tout cas, tout ceci réaffirme surtout le statut de fondeur tout puissant et l'importance cruciale de TSMC et de ses procédés, et ce n'est certainement pas près de changer, mais une concentration aussi forte a évidemment ses limites et devient déjà clairement problématique... Pour l'anecdote, on ne sait pas exactement combien coûte un A100, considérant qu'une Tesla V100 SXM2 se trouve pour 14500 $ chez des revendeurs, on peut imaginer que la grosse Ampere s'arrache facilement pour plus des mains de Nvidia. (Source)

Restons Zen ! [cliquer pour agrandir]

Un poil avant ?

Chez Icy Dock, disque dur & SSD sont les nouveaux CD

Un peu plus tard ...

Encore du très lourd chez Qnap, avec le TSH973AX !

Tout le monde il manque de GPU !

un peu plus de 2 minutes

Sur le comptoir, au ~même sujet

	Test • Nvidia GeForce RTX 4070 Ti
	Test • Nvidia GeForce RTX 4080
	NVIDIA RTX 4060 : -20 % qu'une 4060 Ti / RX 7600 mais +25 % de la 3060
	GeForce RTX 50 : NVIDIA tente de noyer le poisson avec des carabistouilles
	NVIDIA parachèverait ses GeForce RTX 5090 et RTX 5080, des cartes bien énergivores
	GeForce RTX 50 Series : NVIDIA dévoile ses quatre fantastiques (MAJ)
	NVApp : la nouvelle application NVIDIA pour gérer sa GeForce
	NVIDIA écrabouille la concurrence sur le marché des cartes graphiques desktop
	La face de L'ACE (feat. NVIDIA + IA)
	NVIDIA va bien, et va bien aller. D'après vous, pourquoi ?
	IA : Groq et ses LPU pourraient bien venir gâcher la fête de NVIDIA et autres vendeurs de GPU
	NVIDIA incrimine les CPU Raptor Lake d'Intel pour les instabilités dans les jeux

Suivez-nous sur G.Actualités

Les 6 ragots

Les ragots sont actuellement
ouverts à tous, c'est open bar !

Changer l'ordre d'affichage des ragôts
Vous devez être identifié pour changer cette option !

par Matthieu S., le Mercredi 09 Décembre 2020 à 17h54

par Unragoteursansespace embusqué le Mercredi 09 Décembre 2020 à 16h28

À ceux qui disaient que c'était la gdrr6 le problème, aïe, aie.Ici c'est aussi de la gdrr6x pourtant.Comme quoi le fond du problème est ailleurs.

Non, l'A100 40 Go embarque de l'HBM2 et le modèle 80 Go de l'HBM2E

par Unragoteursansespace embusqué, le Mercredi 09 Décembre 2020 à 16h28

À ceux qui disaient que c'était la gdrr6 le problème, aïe, aie.Ici c'est aussi de la gdrr6x pourtant.Comme quoi le fond du problème est ailleurs.

par m du Grand Est, le Mercredi 09 Décembre 2020 à 12h25

par Jemporte le Mercredi 09 Décembre 2020 à 09h02

Déjà Apple a évacué les lignes de prod TSMC pour le 5nm et Nvidia produit tout sauf son A100 chez Samsung. AMD n'a qu'à produire une partie de ses CPU et GPU chez Samsung en 8nm. Par exemple une variante moins pêchue des Zen 2, et les GPU bas de gamme RDNA2, histoire de rééquilibrer le marché. Il faut profiter de la baisse des prix chez Samsung comme Nvidia.

"'n'a qu'à"
C'est pas si simple que ça, de passer d'un node à l'autre et de changer de procédé de gravure.

par Ideal, le Mercredi 09 Décembre 2020 à 09h58

par Zoroastre le Mercredi 09 Décembre 2020 à 09h36

Il me semble que Samsung a déjà du mal a fournir nvidia...

En + faudrait pour AMD de refaire le design de A à Z car les process 8nm de samsung sont certainement pas du tout IP compatible avec les 7nm de TSMC (qui + est le EUV....) ce qui induit de changer en profondeur l'architecture des puces...
Bref lol .. passons il s'est Jemporté.