COMPTOIR
Neeed   
register

Vera, le CPU ARM de NVIDIA, vient challenger les Xeon et EPYC

Il y a deux mois, NVIDIA avait donné à voir ses CPU Vera. Désormais, Phoronix nous donne un aperçu de leurs performances. Un avant-goût de la conclusion de notre confrère ? « Vera a dépassé mes attentes ». Ou encore : « je peux au moins affirmer qu’il s’agit, d’après les tests disponibles, du processeur serveur ARM sous Linux le plus performant que j’aie jamais testé ».

cpu vera

© Phoronix

Présentons le champion. Le CPU Vera n’est pas le premier de l’entreprise. Il succède à Grace, son précédent modèle. Cette nouvelle génération exploite 88 cœurs / 172 threads Armv9.2 personnalisés baptisés « Olympus ». Les cœurs intègrent une prise en charge native du FP8, ce qui permet de traiter directement certaines charges de travail d’IA au niveau du CPU, grâce à une implémentation SVE2 en 6 blocs de 128 bits. La puce affiche par ailleurs une bande passante mémoire de 1,2 To/s et peut gérer jusqu’à 1,5 To de mémoire LPDDR5X au format SOCAMM2. Enfin, la seconde génération du Scalable Coherency Fabric atteint 3,4 To/s de bande passante de bisection et assure l’interconnexion de l’ensemble des cœurs.

Phoronix teste, NVIDIA encadre, et Vera s’impose

Dans l’examen préliminaire de Phoronix, les modèles concurrents alignés sont les AMD EPYC Turin et ceux appelés « Turin Dense », à savoir les EPYC 9455, 9755, 9475F et 9575F. Pour les processeurs Intel Xeon Granite Rapids, nous retrouvons le 6980P. Tous ont été testés dans des configurations simple et double socket. Les benchmarks incluent également le CPU Grace de NVIDIA. Pour mémoire, il possède 72 cœurs Arm Neoverse V2.

Pour nuancer les propos enthousiastes, partiellement tronqués et choisis pour pimenter l’intro, NVIDIA n’a autorisé qu’un ensemble limité de tests sur sa puce encore en préproduction. Nous vous enjoignons à consulter l’article source pour découvrir précisément lesquels — en supposant qu’ils vous soient familiers. De façon synthétique et dans l’ordre de leur présentation, les charges de travail couvrent la compilation de code, les performances mémoire et de compression via Stream et Zip, l’encodage vidéo avec SVT-AV1, les charges Python et Java, les opérations de compression et d’exécution de scripts (Zstandard et LuaJIT), l’analyse de motifs via Regex, ainsi que les performances sur serveur de base de données avec ClickHouse. Ou, de manière encore plus simplifiée, elles portent sur la compilation, les tests mémoire et de compression, l’encodage vidéo, les charges de travail généralistes et l’analyse de données côté serveur.

Sur la moyenne géométrique de l’ensemble des résultats, Vera s’est hissé en tête du classement. Son score est environ 11 % supérieur à celui de la meilleure puce d’AMD du lot et environ 55 % supérieur à celui du Xeon. Vous noterez que le Xeon est meilleur seul qu’en duo. La configuration double socket le pénalise dans ce cadre précis (ce n’est pas le cas pour les puces EPYC, cela dit). Par rapport à Grace, le gain délivré par Vera monte à 68 %.

moyenne tests vera phoronix

© Phoronix

L’autre donnée à prendre en compte est bien sûr celle du TDP. À ce propos, l’article de Phoronix concède que l’efficacité énergétique et les performances par watt restent « une question ouverte », d’autant « qu’il n’a pas été permis d’enregistrer les mesures de consommation du CPU ». Notre confrère souligne néanmoins qu’à ce stade, ces données ne seraient pas forcément représentatives de ce que les clients constateront lors de l’optimisation énergétique des serveurs en production plus tard dans l’année.

À titre indicatif, sachez donc que le CPU Vera affiche un TDP de 450 watts. Il faut ajouter à cette puissance 50 W pour sa mémoire LPDDR5X. Cela aboutit à une enveloppe d’environ 500 W ; puissance que les processeurs AMD EPYC Turin et Intel Xeon Granite Rapids les plus haut de gamme atteignent déjà pour le CPU seul. Reste qu’étrangement, notre confrère se garde de communiquer le TDP de Grace. Or, celui-ci est de 500 W pour la Grace CPU Superchip constituée de deux CPU Grace. Pour le CPU « seul », appelé NVIDIA Grace C1, l’entreprise renseigne une « capacité de configuration de 140 W à 250 W ». Sinon, c'est 500 W pour l'EPYC 9755 et le Xeon 6980P ; 400 W pour les 9575F et 9475F ; 300 W pour le 9455.

Pour revenir aux conditions de tests, voici ce qu’en dit Michael Larabel, le testeur :

Bien sûr, certaines réserves s’appliquent : NVIDIA a limité le périmètre des benchmarks initiaux aux marchés visés et aux cas d’usage ciblés. Mais les tests étaient malgré tout suffisamment variés pour permettre de tirer des conclusions générales, d’autant plus qu’il s’agit pour la plupart de charges que j’utilise depuis des années dans mes campagnes de benchmarks. Les résultats d’aujourd’hui ne représentent qu’un petit sous-ensemble de mon approche habituelle, qui consiste davantage à pratiquer un "bombardement de saturation" de benchmarks afin de couvrir la diversité des charges modernes et les centres d’intérêt très variés des lecteurs. Espérons que nous pourrons faire cela plus librement lorsque Vera montera en puissance plus tard cette année.

Manquent aussi à l’équation des benchmarks d’IA agentique pour lesquels il faudra patienter jusqu’à l’été. Mais en l’état, notre confrère voit déjà Vera comme « la concurrence la plus sérieuse jamais vue face aux processeurs x86_64 d’Intel et d’AMD » (sur le secteur des centres de données).

Il suspend néanmoins sa sentence au positionnement tarifaire ainsi qu’au calendrier. Les EPYC Venice basés sur l’architecture Zen 6 sont attendus courant 2026. Ils promettent des gains significatifs par rapport aux EPYC Turin. Michael Larabel n’exclut pas qu’AMD « reprenne la tête sur les charges de travail variées situées en dehors des scénarios spécifiquement optimisés pour Vera ». Concernant les Intel Xeon Diamond Rapids, ils ne verront en revanche pas le jour avant 2027, en principe. Sur la durée, Michael Larabel considère que le succès de NVIDIA dépendra de sa capacité à maintenir « un rythme agressif de renouvellement matériel » et « à parvenir à innover plus rapidement que le cycle d’environ deux ans séparant les générations EPYC ».

Source : Phoronix
Un poil avant ?

SiPearl allume Rhea1, le processeur européen

Yapa de ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !