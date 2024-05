Cette semaine a été marquée par les annonces de Microsoft et Qualcomm ; des annonces centrées sur des ordinateurs portables faisant la part belle à l’intelligence artificielle grâce à l’association des processeurs Snapdragon X Series et de l’écosystème Windows Copilot+ PC. Les fondements de cette idylle ? La présence d’un NPU (Neural Processing Unit) relativement costaud au sein des puces susmentionnées. Pour le moment, ce mariage est assez exclusif, mais Microsoft a déjà affiché sa volonté de batifoler avec Intel et AMD à l’avenir, lorsque ces deux entreprises auront des processeurs dotés de plus gros NPU à présenter – la firme de Redmond mentionne explicitement Lunar Lake et Strix dans son communiqué.

Peu après cette union entre Microsoft et Qualcomm, Intel s’est ainsi rapidement manifestée pour présenter ses processeurs Lunar Lake, des puces fortement NPU-tées. AMD ne dit mot pour le moment, mais l’entreprise fera très certainement des annonces relatives à ses processeurs Zen 5 au cours des prochaines semaines.

Un grand absent de ce plan à quatre : NVIDIA. Pourtant, en matière d’IA, c’est la première entreprise à laquelle beaucoup de gens pensent. Elle n’a pas attendu les NPU pour intégrer des unités de traitement spécifiques à l’IA au sein de ses GeForce, et par extension se tailler une énorme part de marché sur ce secteur : les cœurs Tensor des GeForce RTX accélèrent déjà bon nombre de charges de travail IA – et ne parlons de son succès dans le secteur du HPC (pour sa plate-forme IA, NVIDIA avance plus de 500 applications et jeux supportés, par plus de 100 millions de PC et stations de travail RTX AI dans le monde). Bon, pour être tout à fait précis, Microsoft n’a pas totalement oublié les cartes graphiques dédiées ; la firme projette aussi des expériences Copilot+ « à l’avenir », avec « des cartes graphiques puissantes telles que NVIDIA GeForce RTX et AMD Radeon » ; mais apparemment, sous réserve qu’elles collaborent avec un NPU.

Quoi qu’il en soit, à défaut de commercialiser, à ce stade, des processeurs intégrant des NPU, NVIDIA continue de choyer ses GeForce. La société a publié un pilote R555 Game Ready qui optimise les performances IA dans plusieurs applications. En outre, au cours d’une interview, Jensen Huang n’a pas fermé la porte à l’arrivée de processeurs Arm NVIDIA l’année prochaine.

Un pilote R555 pour booster les performances IA des GeForce

Commençons parle nouveau pilote NVIDIA R555 Game Ready. Il apporte des optimisations qui ciblent en grande partie une gamme de LLM (Large Language Models) tels que Phi-3, Llama 3, Gemma et Mistral, lesquels alimentent les dernières avancées d'IA générative. Avec cette version R555, les GPU RTX délivrent des performances d'IA jusqu'à 3 fois plus rapides avec ONNX Runtime (ORT) et DirectML (deux outils utilisés pour exécuter des modèles d'IA localement sur les PC Windows), selon l’entreprise, qui revendique des gains sur l'ensemble des types de données INT4 et FP16.

De plus, NVIDIA indique avoir optimisé les flux de travail IA au sein de WebNN - un standard qui aide les développeurs d'applications web à accélérer les modèles d'apprentissage profond avec des accélérateurs d'IA sur appareil, comme les Tensor Cores – afin d’apporter les performances des GPU RTX directement dans les navigateurs.

Par ailleurs, Microsoft et NVIDIA collaborent pour accélérer davantage les performances des GPU RTX via le support DirectML sur PyTorch. Concrètement, PyTorch va prendre en charge les backends d'exécution DirectML, ce qui permettra aux développeurs Windows d'entraîner et d'inférer des modèles d'IA complexes sous Windows de manière native.

Vous pouvez prendre connaissance de tous les ajouts sur le blog de NVIDIA.

Copilot+ et matériel NVIDIA

NVIDIA a profité de cette publication pour vanter les capacités IA de ses GPU. Déjà, la société rappelle un fait : elle revendique le lancement des premiers GPU PC avec accélération dédiée à l'IA – en l’occurrence, via la série des GeForce RTX 20 (Turing) dotées de Tensor Cores – ainsi que le premier modèle d'IA largement adopté pour fonctionner sous Windows, le NVIDIA DLSS, en 2018. Dans la guerre des TOPS, la société souligne aussi que ses derniers GPU délivrent jusqu'à 1 300 trillions d'opérations par seconde de performances dédiées à l'IA, là où les processeurs Intel / AMD / Qualcomm les plus rapides qui sortiront cette année plafonnent à 100 TOPS.

À propos de l’exploitation des fonctionnalités IA de Windows sur son matériel, NVIDIA écrit dans son communiqué : « Dans les mois à venir, nous sommes impatients de lancer des PC Copilot+ équipés d'un GPU RTX, offrant aux utilisateurs des performances accrues pour s'attaquer aux charges de travail IA locales exigeantes, ainsi que les nouvelles fonctionnalités Copilot+ de Microsoft ». Sur la base de cette formulation, seuls les appareils futurs semblent toutefois dignes d’être estampillés Copilot+.

Cependant, bien que le texte se borne à mentionner des PC équipés de GPU RTX, des rumeurs sur d’éventuels processeurs Arm NVIDIA destinés au segment grand public circulent depuis longtemps. Un article de Reuters évoquait encore cette ambition en octobre dernier. Cette semaine, dans le cadre d’une interview accordée à la Bloomberg Television, Michael Dell et Jensen Huang, respectivement PDG de Dell et de NVIDIA, ont plus ou moins confirmé les projets de cette dernière en la matière. À une question portant sur l’arrivée de « PC IA NVIDIA », les deux comparses ont botté en touche pour le moment, mais ils ont invité Ed Ludlow de Bloomberg à en reparler l’année prochaine.

Si l’on se limite aux faits, NVIDIA collabore actuellement avec Mediatek autour de SoC Dimensity pour le secteur automobile. À en croire les derniers ragots, les deux sociétés plancheraient également sur un processeur pour les consoles portables ; la société taïwanaise s’occuperait de la composante CPU, et NVIDIA de la composante GPU. Rappelons que NVIDIA travaille aussi avec Nintendo sur la Switch 2. Pour mémoire, la Switch actuelle mobilise un SoC NVIDIA Tegra X1 combinant cœurs CPU Arm et puce graphique Maxwell. Par ailleurs, la société propose déjà des processeurs « complets » pour les centres de données : les Grace Superchip.

Sur le papier, NVIDIA a toute les armes en main pour lancer des processeurs grand public Arm ; d’autant plus en collaborant avec MediaTek. Ajoutez à cela le nouvelle dimension prise Qualcomm avec ses Snapdragon X Series et les avancées de Windows-on-Arm qu’elle induit, et vous avez un alignement des planètes a priori plutôt favorable.