COMPTOIR
  
register

Ryzen AI Strix Halo : 4 nm intégral et interconnexion entre chiplets atypique

Les Ryzen AI Strix Halo nous intriguent depuis plusieurs mois ; ils sont officiels depuis le CES 2025. Et apparemment, ce ne sont pas « juste » de musculeux processeurs atrophiés de cœurs : leur flux sanguin inter-chiplets est assuré par un système d’interconnexion parallèle de type « sea of wires » plutôt que via une approche SerDes (serializer/deserializer) calquée sur celle des Ryzen 9000 desktop.

ryzen ai max

Du 4 nm partout © HardwareLuxx

Moins de latence

C’est ce qui ressort d’une séquence proposée par la chaîne Chips and Cheese et relayée notamment par HardwareLuxx. La source nous apprend que les Ryzen AI Strix Halo exploitent logiquement deux Core Complex Dies (CCD). Ils sont élaborés sur le processus N4 (4 nm) de TSMC et comprennent jusqu'à huit cœurs Zen 5, comme ceux des Granite Ridge et des Ryzen précédents. Seulement pour les puces mobiles, le processus de gravure N4 sert également à l’IOD (I/O die) ; celui des Ryzen desktop Zen 5 est fabriquée en 6 nm (N6).

Ce n’est pas le seul changement ; un autre intervient dans les échanges entre les deux CCD et l’IOD. Alors que la série Ryzen 9000 utilise des PHY SerDes pour convertir les transmissions parallèles en transmissions sérielles, Strix Halo met en œuvre la transmission directe de données parallèles par le biais de plusieurs connexions physiques.

Sur le papier, le principe du SerDes est simple : il convertit les données parallèles en données série (la sérialisation), puis les reconvertit en données parallèles à l'arrivée (la désérialisation). Le but de la manœuvre est de réduire le nombre de connexions entre l'émetteur et le récepteur. Notre confrère de HardwareLuxx indique qu’un telle connexion permet une transmission efficace sur de plus longues distances, car les signaux sériels sont moins sensibles aux interférences et plus faciles à transmettre qu’en mode parallèle, et que cette transmission en série permet d'atteindre des débits de données plus élevés par ligne. En revanche, cette approche a un impact négatif sur la latence et la consommation d’énergie.

Pour Strix Halo, une connexion dite « sea of wires » transmet les données en parallèle via une multitude de lignes (les canaux qui transportent les données). Par apport au SerDes, les latences sont ainsi plus faibles, car les données sont transmises simultanément. Il n'y a pas de délais imputables à la sérialisation / désérialisation. En outre, la distance entre les puces est suffisamment courte pour ne pas souffrir d’interférences.

La contrepartie de cette accumulation de lignes parallèles : forcément davantage de place occupé sur le circuit imprimé, plus de broches pour la connexion externe, ce qui aboutit à une conception globalement plus complexe. En conséquence, il est probable qu’AMD ait dû procéder à de petites modifications des CCD.

Quoi qu’il en soit, ce changement d'approche aurait été « motivé par la nécessité de réduire la latence et la consommation d'énergie dans les charges de travail à forte intensité de données, où une communication constante à large bande passante entre les chiplets est cruciale ».

Il faudra patienter encore quelques semaines pour découvrir le résultat ; les Ryzen AI Max Series doivent faire leurs preuves avant la fin du semestre.

Un poil avant ?

Les Ryzen retrouve un Raphael, déclassé sous une tente de camping

Un peu plus tard ...

Pas mal d’infos rassurantes pour les RX 9000 (MAJ)

Les 5 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Jemporte, le Samedi 18 Janvier à 22h39  
A propos. Il semble clair que le RDNA 4 apporte la FSR4, mais qu'il y une limitation matérielle à l'implémenter sur RDNA3. A tel point que les Strix Hallo avec leur gros IGP intégré en RDNA 3.5 n'en seront pas dotés.

Donc les portables avec ces APU sont certes gaming mais avant tout professionnels, avec le NPU en plus.
Donc "l'enthousiast gaming" tel que le décrit AMD à côté de Mobile Workstation, n'est pas le meilleur usage de ces APU, qui serait probablement meilleur avec un CPU mobile "moyen" sans NPU genre 6 ou 8 cours et un GPU mobile séparé.
par Un ragoteur 'ArthaX' du Centre-Val de Loire, le Jeudi 16 Janvier à 17h44  
J'en ai discuté avec mes collègues des performances des futurs Pc portables, et le problème du SerDes est arrivé sur la table. Un petit APU dont la performance n'est pas un problème, le SerDes est une solution économique, mais pour des APU dont la performance est la caractéristique principale, les latences induites par le SerDes est un très gros problème.

En parallélisant l'interconnexion des Chiplet c'est la voie vers des PC portables hautes performances. Est-ce que AMD veut essayer de se battre avec des SoC ARM et des GPU mobile de nVidia en même temps ?
nVidia va venir sur les PC portables à base d'ARM sous Linux, vu que les SoC Jetson sont éprouvé et disponible depuis plus de 5 ans maintenant. Pour les GPU mobile, si AMD fournis des APU aussi puissant que des Playstion 4 pro, les GPU mobile se doivent d'être beaucoup plus puissant pour être pertinent.

@++
par Un ragoteur bio du Grand Est, le Jeudi 16 Janvier à 11h27  
par Un champion du monde en Auvergne-Rhône-Alpes le Jeudi 16 Janvier à 08h53
Cet IOD a un bus de 256bit pour la ram si je me rappelle bien, du coup il n'est pas transposable tel quel pour de l'AM5 je pense.
Pas l'IOD, mais les CCD : une version "allégée" de l'IOD présent ici, qu'il ait un IGP digne de l'IOD actuel (2 CU mis à jour), de Strix Point (8, 12 ou 16 CU, en fonction de la place disponible) ou de Phoenix2 (4 CU), permettant au passage de pousser une vieille archi vers la sortie.

On peut aussi se poser la question d'une intégration centralisée du L3 sous l'IOD plutôt que les CCD (en l'état, le L3 reste plus ou moins "privé" à son CCD) et d'un certain nombre de cores (Zen5c?) en vue de diminuer au maximum la consommation à faible charge.
par Un champion du monde en Auvergne-Rhône-Alpes, le Jeudi 16 Janvier à 08h53  
par Un ragoteur bio du Grand Est ?? le Mercredi 15 Janvier à 21h16
C'est très certainement la prochaine étape de l'évolution des Zen "classiques".

Ce qui est étrange, c'est qu'il semblerait logique que ces CCD soient généralisés, impliquant vraisemblablement une nouvelle fournée de Zen5.
Cet IOD a un bus de 256bit pour la ram si je me rappelle bien, du coup il n'est pas transposable tel quel pour de l'AM5 je pense.
par Un ragoteur bio du Grand Est ••, le Mercredi 15 Janvier à 21h16  
C'est très certainement la prochaine étape de l'évolution des Zen "classiques".

Ce qui est étrange, c'est qu'il semblerait logique que ces CCD soient généralisés, impliquant vraisemblablement une nouvelle fournée de Zen5.