NVIDIA anticipe l’après-Blackwell avec Rubin CPX |
————— 11 Septembre 2025 à 13h45 —— 422 vues
NVIDIA anticipe l’après-Blackwell avec Rubin CPX |
————— 11 Septembre 2025 à 13h45 —— 422 vues
Non contente de vendre ses GPU Blackwell, NVIDIA anticipe déjà la suite. Lors du AI Infra Summit, l’entreprise a dévoilé Rubin CPX. Un patronyme avec lequel il faudra se familiariser, puisqu’il succédera à Blackwell Ultra (Blackwell Ultra a été présenté début août). Le futur reste de mise : s’il est déjà esquissé, Rubin CPX n’est attendu que pour fin 2026, soit quelques mois après les GPU Rubin classiques.
Ce Rubin CPX se définit comme un accélérateur spécialisé conçu pour les modèles d’IA à contexte massif, et plus particulièrement pour l’inférence dans les systèmes reposant sur le test-time scaling. Souvent abrégé TTS, ce terme désigne une méthodologie consistant à ajuster dynamiquement les ressources mobilisées au moment de l’inférence, en fonction de la complexité de la requête. Rubin CPX doit ainsi éviter les goulots d’étranglement computationnels dans les scénarios à contexte étendu, où les modèles d’IA traitent plusieurs millions de tokens simultanément.
Sur le plan matériel, Rubin CPX adopte une conception à un die, contrairement aux Blackwell et Blackwell Ultra qui sont en double-die. La puce délivre 30 PetaFLOPS de puissance de calcul NVFP4. Elle embarque également quatre encodeurs NVENC et quatre décodeurs NVDEC vidéo, directement intégrés au die, et s’accompagne de 128 Go de mémoire GDDR7. Les spécifications de bande passante mémoire n’ont pas été précisées, mais avec une vitesse de 30 Gbit/s et une interface 512 bits, on peut l’estimer à environ 1,8 To/s.
Ces variantes spécialisées CPX ont vocation à s’associer aux GPU Rubin standards au sein de la plateforme Vera Rubin NVL144 CPX. Cette configuration hybride vise 8 ExaFLOPS de puissance de calcul agrégée, avec 1,7 Po/s de bande passante mémoire, pour un déploiement en rack complet. Celui-ci intégrera des adaptateurs réseau ConnectX-9 1600G, un switch Spectrum6 capable de 102,4 Tbit/s, ainsi que des optiques co-packagées.
5 milliards de dollars de revenus pour 100 millions investis, soit un retour x50 ; vous achetez ?
Comme mentionné en introduction, NVIDIA prévoit un déploiement pour fin 2026. Les GPU Rubin classiques sont plutôt attendus en début d'année.
 | |
 | |
 | |
 | |
 | |
 | |
 | |
 | |
 | |
 | |
 | |
 |