COMPTOIR
register

×

NVIDIA anticipe l’après-Blackwell avec Rubin CPX
L'avenir tracé par NVIDIA : Vera puis Feynman

Non contente de vendre ses GPU Blackwell, NVIDIA anticipe déjà la suite. Lors du AI Infra Summit, l’entreprise a dévoilé Rubin CPX. Un patronyme avec lequel il faudra se familiariser, puisqu’il succédera à Blackwell Ultra (Blackwell Ultra a été présenté début août). Le futur reste de mise : s’il est déjà esquissé, Rubin CPX n’est attendu que pour fin 2026, soit quelques mois après les GPU Rubin classiques.

rubin cpx

Accélérateur IA cherche contextes massifs

Ce Rubin CPX se définit comme un accélérateur spécialisé conçu pour les modèles d’IA à contexte massif, et plus particulièrement pour l’inférence dans les systèmes reposant sur le test-time scaling. Souvent abrégé TTS, ce terme désigne une méthodologie consistant à ajuster dynamiquement les ressources mobilisées au moment de l’inférence, en fonction de la complexité de la requête. Rubin CPX doit ainsi éviter les goulots d’étranglement computationnels dans les scénarios à contexte étendu, où les modèles d’IA traitent plusieurs millions de tokens simultanément.

rubin cpx 1m token

rubin cpx vs gb300

Sur le plan matériel, Rubin CPX adopte une conception à un die, contrairement aux Blackwell et Blackwell Ultra qui sont en double-die. La puce délivre 30 PetaFLOPS de puissance de calcul NVFP4. Elle embarque également quatre encodeurs NVENC et quatre décodeurs NVDEC vidéo, directement intégrés au die, et s’accompagne de 128 Go de mémoire GDDR7. Les spécifications de bande passante mémoire n’ont pas été précisées, mais avec une vitesse de 30 Gbit/s et une interface 512 bits, on peut l’estimer à environ 1,8 To/s.

Ces variantes spécialisées CPX ont vocation à s’associer aux GPU Rubin standards au sein de la plateforme Vera Rubin NVL144 CPX. Cette configuration hybride vise 8 ExaFLOPS de puissance de calcul agrégée, avec 1,7 Po/s de bande passante mémoire, pour un déploiement en rack complet. Celui-ci intégrera des adaptateurs réseau ConnectX-9 1600G, un switch Spectrum6 capable de 102,4 Tbit/s, ainsi que des optiques co-packagées.

vera rubin nvl 144 cpx

vera rubin nvl 144 cpx 2

5 milliards de dollars de revenus pour 100 millions investis, soit un retour x50 ; vous achetez ?

Comme mentionné en introduction, NVIDIA prévoit un déploiement pour fin 2026. Les GPU Rubin classiques sont plutôt attendus en début d'année.

L'avenir tracé par NVIDIA : Vera puis Feynman [cliquer pour agrandir]

Le communiqué de NVIDIA ; un article de Forbes si vous souhaitez consulter d'autres diapositives.
Un poil avant ?

Promopub • Une clé Office, Windows 11/10 ou autres ? C'est par ici et avec un avis.

Un peu plus tard ...

Les Radeon privent de la meilleure expérience GeForce Now

Yapa de ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !