COMPTOIR
  
register

Test • Intel Core i7

 

• Nehalem : une nouvelle architecture

 

Depuis l'échec cuisant de l'architecture Netburst qui animait les Pentium 4, Intel a revu profondément sa stratégie en termes d'architecture et de procédé de gravure. En effet, plus question de "pondre" une architecture pour une dizaine d'années et souffrant d'un manque d'efficacité face à la génération précédente et se retrancher derrière une supposée supériorité du procédé de gravure pour combler ses manques et prévoir son évolution. Toute nouvelle architecture devra donc être efficace à son lancement quitte à être moins novatrice que Netburst à son époque (pour le résultat pratique que l'on connait) et second point important, elle utilisera un procédé de gravure déjà éprouvé par la précédente génération. Elle disposera ensuite d'un "refresh" employant un procédé de gravure plus fin l'année suivante.

Le passage à un procédé de gravure plus fin s'appelle dans la terminologie Intel un Tick (exemple le Penryn) contre Tock pour la nouvelle architecture (Conroe/Nehalem) :

 

article core i7 puissance-pc tick tock

 

Aujourd'hui avec Nehalem nous avons donc le droit à un Tock c'est à dire, si vous avez bien suivi, une nouvelle architecture mais utilisant un procédé de gravure maitrisé en l'occurrence le 45nm étrenné par Penryn. Ci-dessous un gros plan d'une superbe galette de silicium (Wafer) sur laquelle sont gravés les dies Nehalem :

 

article core i7 puissance-pc photo die nehalem

 

Alors qu'est-ce qui différencie Nehalem de son prédécesseur? En pratique alors que Core est une architecture conçue nativement DualCore avec un cache L2 mutualisé (la version Quad n'étant que l'accolement de deux dies au sein d'une même puce mais sans mutualisation), Nehalem est nativement MultiCore (au moins 8 en prévision). Mais surtout cette architecture a été pensée pour être la plus flexible possible. Pour ce faire le CPU est scindé en 2 partie, la partie Core qui comprend les coeurs d'exécution (+ les caches L1 et L2) et la partie Uncore qui peut comprendre le cache L3, les contrôleurs QPI, le contrôleur mémoire et dans le futur pourquoi pas un ou des contrôleurs graphiques intégrés ou PCI Express.

 

article core i7 puissance-pc cpu modulaire

 

Bref la flexibilité pourra se faire en jouant sur la partie Core (nombre de coeurs) mais aussi sur la partie Uncore en y ajoutant ou retirant les éléments plus ou moins utiles selon la destination du CPU (taille du cache L3 par exemple, contrôleur graphique, etc.). Ci-dessous la description du die par Intel avec le positionnement sur ce dernier des différents éléments.

 

article core i7 puissance-pc description du die

 

Nous n'entrerons pas dans les détails de l'architecture mais nous nous contenterons de décrire les évolutions les plus marquantes. Au niveau des coeurs d'exécution, ils sont très similaires à ceux de Core, notons toutefois l'optimisation des nombreuses unités déjà présentes dans Core afin de les rendre encore plus efficaces et le retour de l'HyperThreading qui a pour but d'optimiser l'utilisation de toutes les unités de calcul du CPU. Mais la grosse nouveauté de cette architecture réside bien en l'intégration (AMD l'a fait depuis l'Athlon64 fin 2003) d'un contrôleur mémoire ou IMC triple canal (excusez du peu) afin de faire plus que la concurrence.

En s'attachant un peu plus en détail aux caches, on se rend compte qu'une fois n'est pas coutume, Intel reprend un précepte initié par AMD à savoir l'utilisation d'un cache unifié de niveau 3 à l'instar du Phenom. On retrouve ici aussi 3 niveaux avec un cache L1 (toujours scindé en 32ko pour les instructions et 32 ko pour les données) un cache L2 cette fois sans mutualisation entre les cores et réduit à 256 Ko (par Core) mais avec une latence de 10 cycles contre 15 à celui de Penryn. Quant au cache L3, ce dernier d'une latence d'environ 40 cycles peut atteindre jusqu'à 8Mo selon le CPU.

 

article core i7 puissance-pc caches

 

Comme toujours chez Intel et contrairement à AMD, les caches sont de type inclusif ce qui signifie qu'il existe au sein du cache L3 une copie des caches L1 et L2. Certes cela diminue d'autant la quantité disponible pour d'autres données mais cela entraine généralement une plus grande efficacité générale. CPUZ dans sa version 1.48 permet de lire sans souci les niveaux de cache d'un Core i7 965 :

 

article core i7 puissance-pc qpi cpuz caches

 

Penryn avait apporté le jeu d'instruction SSE 4.1 à l'architecture Core, Nehalem intègre lui aussi le jeu d'instruction SSE4, 4.2 précisément avec des optimisations pouvant servir entre autres choses à XML.

 

article core i7 puissance-pc sse4.2

 

Page suivante on continue notre description des nouveautés de l'architecture Nehalem par rapport à Core.

 



Un poil avant ?

Les GeForce 180.70 bêta déjà de sortie

Un peu plus tard ...

Le Deneb benchable à plus de 5 GHZ

Yapa de ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !