NVIDIA anticipe l’après-Blackwell avec Rubin CPX

La réception • Actualités • Processeurs

Non contente de vendre ses GPU Blackwell, NVIDIA anticipe déjà la suite. Lors du AI Infra Summit, l’entreprise a dévoilé Rubin CPX. Un patronyme avec lequel il faudra se familiariser, puisqu’il succédera à Blackwell Ultra (Blackwell Ultra a été présenté début août). Le futur reste de mise : s’il est déjà esquissé, Rubin CPX n’est attendu que pour fin 2026, soit quelques mois après les GPU Rubin classiques.

rubin cpx

Accélérateur IA cherche contextes massifs

Ce Rubin CPX se définit comme un accélérateur spécialisé conçu pour les modèles d’IA à contexte massif, et plus particulièrement pour l’inférence dans les systèmes reposant sur le test-time scaling. Souvent abrégé TTS, ce terme désigne une méthodologie consistant à ajuster dynamiquement les ressources mobilisées au moment de l’inférence, en fonction de la complexité de la requête. Rubin CPX doit ainsi éviter les goulots d’étranglement computationnels dans les scénarios à contexte étendu, où les modèles d’IA traitent plusieurs millions de tokens simultanément.

rubin cpx 1m token

rubin cpx vs gb300

Sur le plan matériel, Rubin CPX adopte une conception à un die, contrairement aux Blackwell et Blackwell Ultra qui sont en double-die. La puce délivre 30 PetaFLOPS de puissance de calcul NVFP4. Elle embarque également quatre encodeurs NVENC et quatre décodeurs NVDEC vidéo, directement intégrés au die, et s’accompagne de 128 Go de mémoire GDDR7. Les spécifications de bande passante mémoire n’ont pas été précisées, mais avec une vitesse de 30 Gbit/s et une interface 512 bits, on peut l’estimer à environ 1,8 To/s.

Ces variantes spécialisées CPX ont vocation à s’associer aux GPU Rubin standards au sein de la plateforme Vera Rubin NVL144 CPX. Cette configuration hybride vise 8 ExaFLOPS de puissance de calcul agrégée, avec 1,7 Po/s de bande passante mémoire, pour un déploiement en rack complet. Celui-ci intégrera des adaptateurs réseau ConnectX-9 1600G, un switch Spectrum6 capable de 102,4 Tbit/s, ainsi que des optiques co-packagées.

vera rubin nvl 144 cpx

vera rubin nvl 144 cpx 2

5 milliards de dollars de revenus pour 100 millions investis, soit un retour x50 ; vous achetez ?

Comme mentionné en introduction, NVIDIA prévoit un déploiement pour fin 2026. Les GPU Rubin classiques sont plutôt attendus en début d'année.

L'avenir tracé par NVIDIA : Vera puis Feynman [cliquer pour agrandir]

Le communiqué de NVIDIA ; un article de Forbes si vous souhaitez consulter d'autres diapositives.

Un poil avant ?

Microsoft invite son Xbox Cloud Gaming dans votre véhicule

Un peu plus tard ...

Les Radeon privent de la meilleure expérience GeForce Now

La société met le cap sur les modèles d’IA à millions de tokens.

1 minute et demi

Sur le comptoir, au ~même sujet

	GeForce RTX 40 Series : NVIDIA fait le ménage avant Blackwell, un seul GPU encore produit
	Vers une architecture Blackwell designée en chiplet chez NVIDIA ?
	Avec Jetson Thor, NVIDIA fournit de la matière grise Blackwell aux robots
	De Blackwell Ultra à Vera Rubin : la trajectoire tracée par NVIDIA
	NVIDIA lève le voile sur Blackwell Ultra
	NVIDIA gave sa RTX PRO 5000 Blackwell de 72 Go de VRAM
	CPU ARM Cortex X5, GPU Blackwell et mémoire LPPDR6 : la recette des processeurs IA de NVIDIA ?
	TSMC et NVIDIA signent le premier wafer Blackwell "made in Arizona"
	Test • Nvidia GeForce RTX 4070 Ti
	NVIDIA RTX 4060 : -20 % qu'une 4060 Ti / RX 7600 mais +25 % de la 3060
	GeForce RTX 50 Series : NVIDIA dévoile ses quatre fantastiques (MAJ)
	GeForce RTX 50 : NVIDIA tente de noyer le poisson avec des carabistouilles