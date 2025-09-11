Non contente de vendre ses GPU Blackwell, NVIDIA anticipe dÃ©jÃ la suite. Lors du AI Infra Summit, lâ€™entreprise a dÃ©voilÃ© Rubin CPX. Un patronyme avec lequel il faudra se familiariser, puisquâ€™il succÃ©dera Ã Blackwell Ultra (Blackwell Ultra a Ã©tÃ© prÃ©sentÃ© dÃ©but aoÃ»t). Le futur reste de mise : sâ€™il est dÃ©jÃ esquissÃ©, Rubin CPX nâ€™est attendu que pour fin 2026, soit quelques mois aprÃ¨s les GPU Rubin classiques.

AccÃ©lÃ©rateur IA cherche contextes massifs

Ce Rubin CPX se dÃ©finit comme un accÃ©lÃ©rateur spÃ©cialisÃ© conÃ§u pour les modÃ¨les dâ€™IA Ã contexte massif, et plus particuliÃ¨rement pour lâ€™infÃ©rence dans les systÃ¨mes reposant sur le test-time scaling. Souvent abrÃ©gÃ© TTS, ce terme dÃ©signe une mÃ©thodologie consistant Ã ajuster dynamiquement les ressources mobilisÃ©es au moment de lâ€™infÃ©rence, en fonction de la complexitÃ© de la requÃªte. Rubin CPX doit ainsi Ã©viter les goulots dâ€™Ã©tranglement computationnels dans les scÃ©narios Ã contexte Ã©tendu, oÃ¹ les modÃ¨les dâ€™IA traitent plusieurs millions de tokens simultanÃ©ment.

Sur le plan matÃ©riel, Rubin CPX adopte une conception Ã un die, contrairement aux Blackwell et Blackwell Ultra qui sont en double-die. La puce dÃ©livre 30 PetaFLOPS de puissance de calcul NVFP4. Elle embarque Ã©galement quatre encodeurs NVENC et quatre dÃ©codeurs NVDEC vidÃ©o, directement intÃ©grÃ©s au die, et sâ€™accompagne de 128 Go de mÃ©moire GDDR7. Les spÃ©cifications de bande passante mÃ©moire nâ€™ont pas Ã©tÃ© prÃ©cisÃ©es, mais avec une vitesse de 30 Gbit/s et une interface 512 bits, on peut lâ€™estimer Ã environ 1,8 To/s.

Ces variantes spÃ©cialisÃ©es CPX ont vocation Ã sâ€™associer aux GPU Rubin standards au sein de la plateforme Vera Rubin NVL144 CPX. Cette configuration hybride vise 8 ExaFLOPS de puissance de calcul agrÃ©gÃ©e, avec 1,7 Po/s de bande passante mÃ©moire, pour un dÃ©ploiement en rack complet. Celui-ci intÃ©grera des adaptateurs rÃ©seau ConnectX-9 1600G, un switch Spectrum6 capable de 102,4 Tbit/s, ainsi que des optiques co-packagÃ©es.

Comme mentionnÃ© en introduction, NVIDIA prÃ©voit un dÃ©ploiement pour fin 2026. Les GPU Rubin classiques sont plutÃ´t attendus en dÃ©but d'annÃ©e.