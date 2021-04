Ça n’est un secret pour personne, ARM lorgne fortement en direction du x86 afin de lui grignoter des parts de marché. Il faut dire qu’entre l’entreprise britannique ayant explosée avec l’informatique mobile ainsi que ses architectures basse consommation et les vieilles casseroles de rétrocompatibilité de l’antédiluvien 8086, même les nez les moins fins y voient une occasion de gagner d’l’argent en masse. Pour le grand public, cette offensive se passe via Qualcomm, qui tente son intégration dans des ordinateurs portables avec Windows 10 ARM, mais l’entreprise n’est pas vraiment couronnée de succès faute de performance. Cependant, côté professionnels, l’affaire semble mieux partie, avec une série complète dédiée : les ARM Neoverse, datant de février 2019.

Un design toujours issu du monde mobile afin de mutualiser les expertises — et diminuer les coûts



À l’époque, le Neoverse N1 provenait du Cortex-A76, un CPU pour téléphone portable et tablette : c’est donc sans surprise que la série Neoverse V ainsi que son successeur, le N2, reprenne une inspiration similaire à partir d’un Cortex-A-next encore non précisé. Cependant notre lectorat assidu aura tôt fait de remarquer que ces Neoverse V1 et N2 ne sont pas nouveaux, leur annonce ayant déjà été effectuée en septembre 2020 et abordée sur votre Comptoir favori. Un commentaire pertinent, sauf qu’ARM était alors dans une phase de test interne, et n’était donc pas très loquace quant aux microarchitectures employées : dommage pur un CPU, non ? Fort heureusement, la firme a depuis dévoilé son nouveau jeu d’instruction, l’ARMv9, déverrouillant ainsi dans son arbre de compétence les descriptions de ces nouveaux modèles.

Une slide recyclée de 2020 : comme quoi, ARM tient ses plannings !

Ainsi, ces nouveaux Neoverse permettront une progression sur les deux principales mesures de performance de processeurs : mono- et multithreads. Or, à rentrer dans un nouveau marché — celui des serveurs de calcul — ARM se heurte à des besoins différents, qui conflictent parfois avec ses propres designs internes. Ainsi, les microarchitectures des cœurs, où se situent les enjeux de consommation/performances monocœur ont été scindées en deux séries : les V, proposant des performances maximales, et les N, misant sur l’efficacité énergétique. En ce qui concerne les performances multicœurs, la solution est plus simple : intégrer plus de composants ensemble, une possibilité concrétisée par leur réseau en mesh CMN-700, proposant au maximum 256 cœurs et 512 Mio de cache (L3) partagé par die.

ARM a donc conçu le Neverse V1 pour la performance brute, en se basant sur les fondations du Cortex-X1, lui-même issu d’une conception semi-personnalisée avec des firmes clientes. Par rapport à ce dernier, la principale différence réside dans les instructions vectorielles supportées, qui passent de deux pipelines 128-bit à deux en 256-bit. Rajoutez le support du bfloat16 pour le machine learning, 64 kio de cache L1-D et L1-I supportant la correction d’erreur, 512 kio ou 1 Mio de cache L2 ainsi qu’un pipeline à 11 étages composé de 8 chemins d’exécution, et vous obtenez — selon la maison-mère — un taux d’IPC en augmentation de 50 % par rapport au N1.

Avec ce Neoverse N2, nous comprenons un peu mieux pourquoi ARM a tant attendu avant de dévoilé ses plans : ce design est le premier à intégrer un cœur Armv9.0-A - avant même le Cortex dont il est pourtant dérivé (le Comptoir s’attend donc à une annonce prochainement...). Côté vecteurs, ce N2 est plus raisonnable avec 2 unités d’exécution 128-bit seulement et un pipeline moins large, n’assurant que 5 instructions par cycle au maximum. Côté cache, la sauce est la même que le V1 avec 64 kio de L1D et de L1I, pour 512 kio ou 1 Mio de L2 privé.

Ces produits désormais au catalogue, ARM semble bien partie pour rentrer dans la course au datacenters. Il reste tout de même un facteur de taille : le support logiciel. En effet, toute boite du matériel se heurte, tôt ou tard, à la problématique de l’optimisation voire du développement d’applications pour ses puces ; un point d’autant plus central dans le domaine des serveurs où Intel possède son infrastructure bien étalonnée. Néanmoins, avec le rachat par NVIDIA au tournant et son écosystème CUDA, les cartes pourraient bien être rebattues sous peu : affaire à suivre ! (Source : AnandTech)