COMPTOIR

• Un refresh, oui, mais pas sans évolution

À l’annonce de Raptor Lake comme la suite du schéma PAO (Processus, Architecture, Optimisation), nombreux ont été les déçus — et nous n’y avons pas dérogé. Pourtant, à y regarder de plus près, le Raptor en cache davantage sous le capot qu’il n’y parait : outre le doublement des E-Core, les P-Core voient également leur design revu, et le cache a aussi droit à sa petite mise à jour. Autant de détails qui, individuellement, n’offriraient qu’une poignée de pourcents de gain (bon, avec une grosse main pour les E-Core), mais qui, mis bout à bout, offrent officiellement 15 % de performances en monothread et 41 % en multithread ! Comment cela ? Pour de vrai ? Pour la première réponse, restez ici, nous allons détailler cela ensemble ; pour la seconde, filez directement à la conclusion, bande de pressés !

 

13900k promesses

 

Un air de déjà vu ? L’épopée de la conception de Raptor Lake a également été narrée sous forme d’interview à la sortie de son NDA. Inutile donc de parcourir cette page si vous avez déjà potassé Raptor Lake par ce biais !

 

Une gravure revue

Pour un refresh efficace, pas de secret : la gravure se doit d’avoir évolué, sans quoi les performances stagnent. Et cela tombe bien, les ingénieurs d’Intel Israël, non contents d’avoir apporté 35 % d’amélioration du 10 nm sur Alder Lake, se sont démenées pour apporter un 10 nm (enfin, Intel 7) moins gourmand et plus dense. Ainsi, ce « 10 nm++ » (pour reprendre les anciennes appellations) offre, au choix, soit un gain de 200 MHz en gardant la même consommation, soit une réduction de la tension de fonctionnement de 50 mV en conservant la même fréquence.

 

raptor lake process

 

Rajoutez une revue complète de l’implémentation du P-Core se focalisant sur les points limitant la montée en cadence : en diminuant la longueur des chemins critiques du CPU, la microarchitecture va pouvoir gagner en stabilité à haute fréquence. Or, ces chemins critiques étaient déjà connus puisqu’Alder Lake a déjà été implémenté, ce qui a grandement facilité le travail. Certes, cette décision empêche la réutilisation de masques de gravure pour un refresh des gammes i3 et i5 inférieures (qui resteront donc sur la version Alder Lake pour des raisons de rentabilité), mais le gain de 600 MHz en Thermal Velocity Boost est conséquent… et la puce possède encore selon les bleus de la marge pour l’overclocking.

 

Toujours plus de cœurs !

Outre la fréquence en claire hausse, Raptor Lake brille également par son nombre de cœurs encore jamais vu chez les bleus. Fort du succès d’Alder Lake, Intel a décidé pour cette itération d’augmenter le nombre de clusters efficient — doublé, dans les faits. Une décision qui se justifie par une faiblesse à combler en applicatif par rapport à Zen, une charge de travail pour laquelle le débit d’opérations sur un code régulier compte plus que la performance individuelle des cœurs. Comprendre que le compromis de l’augmentation des E-Core face aux P-Core est plus avantageux, fournissant une efficacité énergétique supérieure et des coûts de production inférieurs. Refresh obligeant, Intel ne pouvaient pas se permettre d’autres modifications pour ce qui est de la puissance de calcul brute : il faut pour cela changer de microarchitecture.

 

raptor lake ecores

 

 

Des caches en évolution

Enfin, tout ce petit monde aurait pu s’entendre tranquillement sur le die, mais aurait alors souffert d’un talon d’Achille douloureux : le débit mémoire. Nous avons pu le voir avec Alder Lake, la DDR5 est nécessaire à l’expression sans restriction de la microarchitecture. Or, le besoin en bande passante mémoire croit avec le nombre de cœurs, c’est pourquoi les spécifications de la DRAM ont été revues. En effet, la DDR5 est désormais supportée jusque 5600 MT/s pour une barrette par canal, et 5200 MT/s si vous en installez deux. Une mise à jour somme toute mineure et habituelle des refresh de la firme, puisque ces fréquences étaient déjà stables sur la quasi-totalité des puces, mais nécessitait l’utilisation de profil XMP. Le L3 subit lui aussi une augmentation (6 Mio sur le 13 900K par rapport au 12900K), mais cette dernière provient uniquement de la mémoire adjointe aux clusters d’E-Core supplémentaires (3 Mio par cluster, auxquels se rajoutent 3 Mio par P-Core). Côté L2, les évolutions sont de mises avec le passage de 1,25 à 2 Mio de cache par P-Core, et 2 Mio à 4 Mio pour les cluster d'E-Core. Cela n'est cependant pas si surprenant, vu que ces valeurs étaient déjà lisibles sur les slides de présentation de l'Architecture Day sauce 2021. Au passage, la fréquence du ring permettant la communication entre les P-Core et les E-Core est gonflée et atteint maximum 5 GHz (900 MHz de plus que sur Alder Lake).

 

raptor lake caches mem

 

Le réel changement provient de la politique de cohérence de cache. Pour permettre aux cœurs de savoir quelle donnée se situe à quel endroit (typiquement pour éviter qu’une variable dans le L3 soit modifiée par un cœur alors qu’une copie plus récente se situait dans le L1 d’un autre cœur), les données des caches sont annotées par des états permettant de guider la transmission des données (faut-il aller regarder dans les caches privés ?) et assurer la séquentialité correcte des opérations d’écriture. Lorsqu’une donnée est partagée entre deux cœurs, cette dernière a par ce mécanisme tendance à faire yo-yo entre les L1 privés de chaque cœur, perdant ainsi des performances et utilisant inutilement les bus intercaches. Avec Raptor Lake, un bit dynamique d’inclusivité/non-inclusivité permet de limiter l’effet du partage en limitant la présence de la donnée dans les caches privés de plus bas niveau. En pratique, cela mène à une utilisation plus efficace des caches, de quoi gonfler d’autant plus les performances en multithread et masquer en partie le besoin accru de bande passante des clusters supplémentaires.

 

C’en est tout pour le tour « papier » de cette nouvelle version ; direction la page suivante pour un le tour de notre exemplaire de test.



Un poil avant ?

Samsung sort sa LPDDR5X kivavite, à 8,5 Gbps, désormais validée

Un peu plus tard ...

Teamgroup aussi lance de la DDR5 de bural qui va aussi vite que Nico quand il a bu du Tabasco !

Les 128 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !