COMPTOIR
  
register

×

40% more IPC !

AMD dévoile davantage sa future architecture Zen
40% more IPC !
Really !
More efficiency !
More more !
Jim Keller was here
And here !
And here too !
Jim was everywhere !
Jim is Zen
Zen is Jim !
Jim love cache
Jim is Complex
Jim is the king at multitasking
Jim implemented some funny stuff
Jim make it happen !
But the cake is a lie !

AMD a profité du congrès Hot Chips pour parler du futur de son architecture Zen et des puces qui pourraient en découler. On a pu déjà avoir des informations à ce sujet avec quelques révélations au sujet de la puce Summit Ridge, ainsi qu'hier soir avec une fuite de la plaquette de présentation que l'on a pu récupérer cette nuit au sujet des CPU Complex. AMD y présente tout un tas de chiffres et de graphiques que nous allons passer en revue ensemble.

 

40% more IPC ! [cliquer pour agrandir]Really ! [cliquer pour agrandir]More efficiency ! [cliquer pour agrandir]

 

Comme on l'avait déjà vu, Zen promet 40% d'IPC supplémentaires par rapport à l'architecture Excavator. Robert y a vu un moyen de faire mousser le produit et la chose est donc ici relativement présentée comme "40% plus de performances", même si dans la pratique il faudra de multiples tests pour estimer le gain en usage réel. Sur le papier, on a donc une architecture plus efficace et aussi plus économe en énergie, pour finir d'enterrer l'ancienne gamme du constructeur et revenir jouer sur les plates bandes du concurrent.

 

More more ! [cliquer pour agrandir]

 

Les promesses sont grandes avec Zen. On se retrouve avec quelque chose de très proche de ce que fait Intel, les coeurs ayant un cache L2 qui leur est propre et un cache L3 unifié par bloc de quatre coeurs, formant un CPU Complex. On retrouve dans ce tableau tout ce que l'on a pu apprendre jusque là , avec tout le détail apporté à la gestion du cache. On a parlé du cache L3 unifié sur Zen, mais ça n'est pas la seule chose qui change puisque le cache L1 qui était de type write-through sous Bulldozer, sera write-back sur la nouvelle architecture.

 

Jim Keller was here [cliquer pour agrandir]And here ! [cliquer pour agrandir]And here too ! [cliquer pour agrandir]

 

C'est même une grosse refonte au niveau du cache -comme du front-end- par rapport a Jaguar et Excavator. Le cache L3 est donné comme cinq fois plus performant, le cache L2 doublerait presque ses performances, tout cela grâce à l'utilisation de SRAM pour ces derniers. Du côté du cache L1, les performances devraient aussi être presque doublées et celui-ci se sépare en deux. On a le cache L1i de 64ko pour les instructions et le L1D de 32ko pour les données. Pour le cache L2, ça sera 512ko par coeur et un CPU Complex (quatre coeurs) se partagera 8Mo de cache L3 (soit 2Mo par coeur).

 

Jim was everywhere ! [cliquer pour agrandir]Jim is Zen [cliquer pour agrandir]Zen is Jim ! [cliquer pour agrandir]

 

Pour rester dans ce qui change grâce à ce nouveau cache, le transfert de données depuis ce dernier vers une FPU (unité de calcul en virgule flottante) est maintenant plus rapide. C'est ici que le cache micro-op fait son boulot en améliorant les prédictions de branchement et en permettant au scheduler d'accélérer la cadence. En parlant de ces derniers, les lignes d'exécutions ont été augmentées avec quatre destinées aux branchements et calculs (ALU) et deux aux opérations mémoire (AGU), à l'instar de ce qu'on trouve chez Intel. Puisqu'on trouve deux schedulers dans l'architecture (la FPU n'est pas la seule à en avoir l'usage) ces modifications profitent aussi à la partie traitant les nombres entiers, on se retrouve ainsi avec deux blocs de traitement qui sont maintenant considérés comme des coprocesseurs indépendants, soit une des grosses lacunes des générations Bulldozer à présent comblée.

 

Jim love cache [cliquer pour agrandir]Jim is Complex [cliquer pour agrandir]Jim is the king at multitasking [cliquer pour agrandir]

 

On a déjà eu le détail d'un CPU Complex hier, mais pour nous assurer que la fuite était bien une copie du document officiel, il est toujours bon d'en remettre une couche. On a donc exactement la même présentation avec quatre coeurs équipés de 512ko de cache L2 et se partageant 8Mo de cache L3 dans un module nommé CCX. En plus de tout cela, AMD offre à son architecture Zen du Simultaneous Multi-Threading (ou SMT), chaque coeur ayant deux threads, exactement comme Intel le fait sur ses puces depuis 2002 sous le nom d'Hyper Threading. Encore un bon point dans le but de combler l'écart qui s'était creusé entre les technologies des deux géants.

 

Jim implemented some funny stuff [cliquer pour agrandir]

 

Une présentation AMD n'est pas réellement complète sans un tableau comparant les nouveautés avec ce qui était déjà disponible. Fait amusant, on n'a pour une fois pas de colonne pour un produit de la concurrence, Excavator se retrouvant seul (et sans argument) face à Zen. Un moyen détourné de présenter deux nouvelles fonctionnalités qui sont exclusives à l'architecture d'AMD, CLZERO (qui vide le cache) et PTE Coalescing (combinant les données).

 

Jim make it happen ! [cliquer pour agrandir]

 

Tout ça mis ensemble, AMD a de quoi présenter une architecture plus performante (promettant même de hautes performances en fonction du nombre de CCX embarqués), plus souple aussi (permettant de remplacer un CCX par un GPU par exemple), plus rapide (merci la nouvelle politique de cache), avec du multithreading et le tout sans trop consommer pour s'adapter à tous les besoins. Un carton plein qui devrait promettre un bel avenir aux puces Zen qui mettent gentiment l'accent sur le traitement initial des instructions. Mais - car il y a toujours un "mais" - il faudra avoir la certitude que ces informations sont réellement ce que l'on pourra voir arriver sur le marché en 2017, car AMD nous a habitués à une communication forçant bien trop souvent le trait, chose qui est devenue pire avec l'arrivée de Robert Hallock.

La dernière page de la plaquette (dont nous avons mis en couleur la partie qui nous chagrine) ne donne vraiment pas l'impression que cette "révélation" soit tout à fait ce que l'on aura à s'offrir l'année prochaine. Espérons que ce petit laïus de fin ne soit qu'un excès de prudence venant d'une firme américaine habituée aux recours collectifs et que Zen répondra effectivement à toutes ses promesses pour enfin avoir de la concurrence dans le monde des CPU.

 

But the cake is a lie ! [cliquer pour agrandir]

Un poil avant ?

AOC avait un casque de réalité virtuelle à présenter à la Gamescom

Un peu plus tard ...

Cooler Master sort sa souris modulaire MasterMouse Pro L

Les 35 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un champion du monde de Pays de la Loire, le Dimanche 18 Septembre 2016 à 09h05  
une chose est sur , si amd arrive a pousser son zen à 3.6ghz/4ghz turbo au lieu 2.8/3.2 turbo, AMD aura réussi a revenir au niveau des I7 de derniere generation et aurai donc un gros avantage sur intel sur le rapport perf / pris ! et perso , je pense qu'il vont y arriver très rapidement .
par cabou83, le Jeudi 25 Août 2016 à 16h02  
par seb4771 le Mercredi 24 Août 2016 à 19h51
En jeu : 90 (oui, on évite le 9590 qui marche pas réellement) => 150 meilleur i7.

Pardon 70%, faut être précis c'est vrai, 1% de mieux c'est tellement important pour les cpu AMD.
On parlera pas APRES o/c du coup ou on doit bien être à +80%.
En jeux c'est particulier, déja met le FX8350 en DDR4 et en PCIe 3.0 comme le I7 6700K. Sans bouger l'IPC l'ecart serait moins grand.
Donc juger un CPU sur le jeux sans prendre en compte la plateforme est ridicule. De plus on sait très bien que les FX ont une bonne perf en multithread mais moins bonne en mono. Donc encore une fois c'est pas top de se baser sur les jeux qui on du mal avec le multithread.
par Un ragoteur embusqué, le Jeudi 25 Août 2016 à 13h39  
par Flow le Mercredi 24 Août 2016 à 17h13
Ah oui la tournure de la phrase m'a induit en erreur, en fait c'est un bloc de 8Mo accessible par tous les coeurs, seulement ceux-ci ne peuvent placer des données que dans 2Mo chacun, évitant de supprimer par mégarde une donnée sur un bloc qui sert à un autre coeur. J'ai bon?
Les caches sont privés mais accessibles par les autres cores. Tu peux voir ça comme le NUMA apparu avec les premiers Opteron, c'est exactement le même principe. Chez Intel c'est pareil d'ailleurs...
par Un rat goth à l'heure de Bretagne, le Jeudi 25 Août 2016 à 12h11  
Franchement, les "40% plus de performances" par rapport à Excavator (autrement dit, on compare Zen à un veau !), je m'en balance comme de ma première paire de chaussettes !

Les deux seuls critères qui m'intéressent sont:
- performances pures par coeur (pas pas CPU), et à la fréquence max, pas à fréquence égale (car il semble qu'AMD soit encore à la rammasse de ce coté !) de Zen par rapport à Skylake.
- comparaison des rapports performances/prix entre Zen et Skylake.
par Xorg, le Jeudi 25 Août 2016 à 05h57  
Si Intel améliorait lui aussi son IPC de 40%, AMD serait dans la merde.
Mais bon, vu qu'Intel nous a habitué à ce que l'IPC s'améliore d'environ 10% à chaque nouvelle génération ces dernière années, AMD a sans doute rien à craindre. Ou pas.
par Clem, le Mercredi 24 Août 2016 à 22h19  
Cadeau amd
Ça pourrait les aider quand y'a pas jim keller
par Un ragoteur de Pays de la Loire, le Mercredi 24 Août 2016 à 20h07  
Il parle du message de Clem un peux plus bas (et compare un cpu a 370€ et un a 170€ (mais passons..) qui montre le FX8350 40% en dessous du i7 6700k
par Clem, le Mercredi 24 Août 2016 à 20h03  
par seb4771 le Mercredi 24 Août 2016 à 19h51
En jeu : 90 (oui, on évite le 9590 qui marche pas réellement) => 150 meilleur i7.

Pardon 70%, faut être précis c'est vrai, 1% de mieux c'est tellement important pour les cpu AMD.
On parlera pas APRES o/c du coup ou on doit bien être à +80%.
Un lien ? Quels cpu's ?
par Un ragoteur de Pays de la Loire, le Mercredi 24 Août 2016 à 20h00  
par seb4771 le Mercredi 24 Août 2016 à 19h51
En jeu : 90 (oui, on évite le 9590 qui marche pas réellement) => 150 meilleur i7.

Pardon 70%, faut être précis c'est vrai, 1% de mieux c'est tellement important pour les cpu AMD.
On parlera pas APRES o/c du coup ou on doit bien être à +80%.
90 c'est 60% de 150... et pas 70
par seb4771, le Mercredi 24 Août 2016 à 19h51  
par Clem le Mercredi 24 Août 2016 à 16h34
En retard de 80% minimum ? Ou tu vas chercher ces conneries ? Y'a pas tant de différence entre sandy/ivy/haswell/skylake ... lien
lien
En jeu : 90 (oui, on évite le 9590 qui marche pas réellement) => 150 meilleur i7.

Pardon 70%, faut être précis c'est vrai, 1% de mieux c'est tellement important pour les cpu AMD.
On parlera pas APRES o/c du coup ou on doit bien être à +80%.
par xenogear, le Mercredi 24 Août 2016 à 19h42  
Bientôt Zen++
par Baba the Dw@rf, le Mercredi 24 Août 2016 à 18h13  
par Flow le Mercredi 24 Août 2016 à 17h13
Ah oui la tournure de la phrase m'a induit en erreur, en fait c'est un bloc de 8Mo accessible par tous les coeurs, seulement ceux-ci ne peuvent placer des données que dans 2Mo chacun, évitant de supprimer par mégarde une donnée sur un bloc qui sert à un autre coeur. J'ai bon?

(edit: accessible = "read" et placer des données = "write", pour plus de clarté )
Je ne saurais pas confirmer
J'avoue que j'ai pas compris les détails, je suis juste à peu près sur qu'ils peuvent lire partout. Je pense que si on parle de 4*2 c'est parce qu'il y a physiquement 4 sections de 2mo avec leur "sous-controleur" mais heuuu. Un plus calé pour répondre ??