Intel Architecture Day 2021 • Xe HPG, des GPU bleus en provenance de TSMC

RTX 5070 TI : 68 refs en stock de 797.00 € à 1497.16 € Tendance haussière
RTX 5090 : 42 refs en stock de 2422.78 € à 4301.97 € Tendance haussière
RADEON RX 9070 : 43 refs en stock de 557.99 € à 988.90 € Tendance baissière
RADEON RX 9070 XT : 61 refs en stock de 593.99 € à 970.68 € Tendance haussière
RADEON RX 9060 XT : 69 refs en stock de 309.00 € à 498.06 € Tendance baissière
RTX 5060 : 98 refs en stock de 274.55 € à 550.07 € Tendance haussière
RTX 5060 Ti : 116 refs en stock de 359.10 € à 682.35 € Tendance baissière
Core Ultra 5 245K : 8 refs en stock de 237.88 € à 369.99 € Tendance haussière
Core Ultra 7 265K : 9 refs en stock de 287.99 € à 499.90 € Tendance baissière
Core i7-14700k : 14 refs en stock de 319.00 € à 459.90 € Tendance haussière
Core Ultra 9 285K : 2 refs en stock de 635.66 € à 729.99 € Tendance baissière
Ryzen 5800X3D : 1 ref en stock à 544.16 € Tendance haussière
RTX 4060 ti : 29 refs en stock de 322.99 € à 14359.75 € Tendance baissière
Tendance haussière
RTX 4070 TI SUPER : 1 ref en stock à 1217.93 € Tendance haussière
Ryzen 9700X : 1 ref en stock à 399.90 € Tendance haussière
Ryzen 7700X : 3 refs en stock de 263.00 € à 349.99 € Tendance baissière
Ryzen 7800X3D : 7 refs en stock de 329.99 € à 537.00 € Tendance baissière
ryzen 9800X3D : 7 refs en stock de 466.00 € à 614.99 € Tendance haussière
Ryzen 9900X : 5 refs en stock de 384.00 € à 584.00 € Tendance baissière
RTX 4090 : 8 refs en stock de 2499.99 € à 2989.99 € Tendance baissière
RADEON RX 7700 XT : 13 refs en stock de 399.00 € à 567.99 € Tendance haussière
Ryzen 7950X3D : 5 refs en stock de 637.00 € à 829.99 € Tendance baissière
PS5 Pro : 4 refs en stock de 741.76 € à 799.99 € Tendance haussière

La réception • Actualités • Cartes graphiques

À l’occasion de son Architecture Day 2021, Intel ne s’est pas contenté de causer CPU : comme à son habitude, le fondeur de Santa Clara ne pouvait pas se passer de la causette à propose de sa future gamme de GPU basée sur la microarchitecture Xe, désormais connu sous son appellation commerciale Intel Arc. Dévoilé sous les noms de Xe-HPC et Xe-HPG, ce duo illustre à la perfection les capacités de R&D faramineuses de la firme, qui a réussi en quelques années à faire sortir ex nihilo (ou quasiment) non pas une, mais deux microarchitectures GPU jumelles.

Dédié au hardcore gamers, Xe-HPG se matérialise par son implémentation dans le SoC Alchemist, prévu pour Q1 2022, auquel fera suite Battlemage, Celestial puis Druide dans les années suivantes - un petit message très subtil des bleus quant à l’usage destiné à ces puces.

Des puces au nom de classe de RPG pour des GPU : why not? [cliquer pour agrandir] [cliquer pour agrandir]

Par rapport au X^e-LP déjà sur le marché, Xe HPG introduit de nombreux changements. La notion d’Execution Units file à la corbeille et est remplacée par des Vector Engines (VE) ainsi que des Matrix Engines (XMX). Probablement du fait de la complexité de faire passer oralement une microarchitecture, le fondeur de Santa Clara n’est pas allé plus loin dans leur fonctionnement : ce sera pour une autre fois ! Cependant, le reste de l’organisation architecturale est, elle, dévoilée : la brique de base se nome X^e-core, et se compose de 16 VE et 16 XMX gérant respectivement des données sur 256 bits et 1024 bits.

xe hpg core t [cliquer pour agrandir]

Ces X^e-core sont ensuite assemblés par 4 en slices, en rajoutant au passage tout ce qui est nécessaire au rendu d’image : le fixed functions servant aux fonctionnalités usuelles (pixel backend, samplers, pipeline de géométrie et de rastérisation), mais, surtout, des unités de Ray Tracing accélérant la totalité du BVH : traversée de l’arbre, intersection avec les Bounding Boxes et intersection avec les triangles (contrairement à AMD qui ne gère que les deux derniers). De quoi préfigurer des performances particulièrement compétitives dans le domaine !

xe hpg core t [cliquer pour agrandir]

Enfin, une ou plusieurs de ces slices sont adjointes à un global dispatch, une sorte de scheduler sauce GPU, et une certaine quantité de cache L2 encore indéterminée afin de former un die utilisable. Si Intel illustre ses propos avec deux exemples à 1 et 8 slices, cela ne dit rien sur les modèles intermédiaires ni sur les fréquences et consommations des bousins. Pour une comparaison frontale avec la concurrence, il y a encore du chemin à faire !

xe hpg core t [cliquer pour agrandir]

À gauche, un design à une seule slice ; à droite, pas moins de 8 slices soit 512 Vector Engines !

Si le niveau architectural met la barre haut, l’herbe n’est pas aussi verte de tous les côtés : en effet, ces GPU seront gravés par... TSMC, avec son N6, et non avec le Intel 7 ou Intel 5 concurrent. Coup dur pour les bleus, pour lequel deux explications sont possibles : soit des raisons de cadence de productions insuffisantes pour satisfaire les besoins en CPU et en GPU sur la même technologie, soit une mise au point insatisfaisante du procédé pour cet usage. Quoi qu’il en soit, ces deux cas de figure auraient pû être traités en amont... et c’est bien là que le bât blesse, le géant bleu accusant à ce niveau des années de gestion hasardeuse.

X^e SuperSampling : l’implémentation maison du DLSS

Puisque X^e intègre des accélérateurs de Ray Tracing ainsi que des unités de traitement vectorielles, il aurait été surprenant de ne pas voir un concurrent du DLSS sortir de la hotte des bleus... bingo, dites bienvenue au X^e Super Sampling. Dans la théorie très proche, le Xe SS est même extrêmement proche du DLSS V2 tous deux tirent partie d’un réseau de neurones utilisant à la fois des informations de rendu immédiat (frame complète) mais également passé (vecteurs vitesse et images précédentes) afin de rendre une version haute définition de l’image pour un coût computationnel plus faible, i.e. une augmentation du taux de FPS.

Machine Learning, Upscaling : les mots-clefs sont présents ! [cliquer pour agrandir]

Illustrée dans une brève démonstration, la chose semble aboutie ; reste qu’un entraînement minutieux du réseau reste nécessaire : comprenez que le rendu de trailers aux images connues d’avance est une chose aisée, et que son intégration au même niveau de qualité dans un titre vidéoludique en est un autre - prenez le DLSS premier du nom, hétérogène dans son niveau de précision visuel selon les titres. Notez d’ailleurs que, au vu de la difficulté du DLSS à se démocratiser, nous émettons quelques doutes sur le panel compatible day one ; à voir si les moyens et les réseaux des bleus leur permettent une prise en charge étendue. Enfin, tout comme le FSR d’AMD, le Xe SS sera également disponibles pour les GPU des autres vendeurs, mais fera alors usage du jeu d’instruction DP4a commun aux cartes graphiques depuis la GTX 1050 environ au lieu des accélérateurs XMX maison.

1080p versus 1080p + ML : la différence est flagrante ! [cliquer pour agrandir]

Par ici pour la conférence complète !

Un poil avant ?

NVIDIA admet que l'acquisition d'Arm n'est pas encore gagnée...

Un peu plus tard ...

Live Twitch • Il a coulé mon porte-avion !

Xe par-ci, Xe par-la, Xe enfin dans nos bras ?

3 minutes et demi

Sur le comptoir, au ~même sujet

	L’architecture Xe3P d’Intel servira aussi bien les PC que les serveurs
	Intel XeSS 1.3 : du mieux à tous les niveaux, mais seulement pour les GPU Arc ?
	Cartes graphiques B580 et B570, XeSS 2 avec Frame Generation ; Intel prend l’initiative
	Avec l’XeSS 3, Intel embrasse la Multi-Frame Generation (MAJ)
	Intel veut ajouter de la Multi-Frame Generation à l'XeSS
	La GH200 de NVIDIA se confronte aux processeurs AMD EPYC et Intel Xeon
	Xeon W-3500 et W-2500 : Intel rafraîchit ses Sapphire Rapids
	Revue de presse des tests de l’Arc B580 : Intel livre une carte graphique enfin compétitive
	Sur le marché des cartes graphiques dédiées, la renaissance d’Intel à 1 %
	AMD continue de prendre des parts de marché à Intel du côté des CPU
	Intel lance ses Arc Pro B70 et B65 avec 32 Go de GDDR6 (MAJ)
	Intel fortifie ses GPU Alchemist dans plusieurs jeux DirectX 11