COMPTOIR
register

Ampère Computing fait-il des processeurs performants ?

Ampere Computing est une start-up qui revient de manière plutôt récurrente sur notre comptoir. En effet, la firme fait dans le ARM haute performance, un segment qui peut avoir de l’avenir également pour le grand public. Néanmoins, les processeurs du jour ne sont pas prévus pour des tours, mais pour des serveurs, puisqu’il est question du M128-30, un CPU qui affiche fièrement 128 cœurs ARM Neoverse N1 cadencés à 3 GHz.

 

Le bousin a été testé par notre confrère Phoronix en simple et en bi-CPU au côté d’un autre processeur de la marque, le Q80, qui, comme son nom l’indique, possède 80 cœurs, en version simple et en bisocket également, ainsi qu’un CPU AMD EPYC 7763 (bisocket, soit 128 cœurs/ 256 threads @ 2.45 GHz) et deux Intel Xeon Platinum 8380 (soit 80 cœurs/ 160 thread @ 3.4 GHz). Alors, kiki gagne, celui qui a le plus de cœurs ? De performance monothread ?

 

ampere m128 30 phoronix 

Hé bien, comme souvent, tout dépendra de la tâche. Si le x86 s’illustre dans divers benchmarks tels John the Ripper, Blender ou encore Stress-NG sauce « CPU Stress », le processeur d’Ampère se défend vaillamment sur la saveur « Vector Math » et « Crypto » de stress-NG, ainsi que m-queen. Ainsi, ce n’est pas tant la puissance brute de calcul qui manque, mais plutôt les moyens de l’exploiter correctement dans des domaines autres que le calcul scientifique linéaire. Notez également que la solution d’AMD s’est montrée systématiquement au-dessus de celle d’Intel, quel que soit le test effectué. En même temps, difficile de le battre avec moins de threads  ! Pour en revenir à ARM, la firme a clairement sa carte à jouer côté serveur où l’écosystème a eu le temps de migrer vers un support du manycore ; ce qui n’est pas (encore ?) le cas de nos bons vieux ordinateurs de bureau et portables. À voir comment les choses évolueront dans le futur !

 

Un poil avant ?

Alibaba ne vendra plus aucun matos pour le minage !

Un peu plus tard ...

Et un nouveau stepping pour le SoC du Rasberry Pi 4 8 Gio

Les 4 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Jemporte, le Jeudi 30 Septembre 2021 à 20h56  
par Un ragoteur bio de Bretagne le Jeudi 30 Septembre 2021 à 18h08
je confirme (comme Linus d'ailleurs) le threadripper 128 threads dans une tour standard au boulot dépote sa maman pour être poli. C'est un monstre en calcul parallélisé fortran mais aussi en monothread, le meilleur achat de mon boulot depuis 15 ans (moins de 3500€ alors qu'on payait facilement des serveurs de calculs anémiques autour des 6000&euro. On ne se pose plus de questions, on parallélise tous calculs en dév (blas lapack opencl) en haut niveau (un thread maitre, les autres en, workers), et les trucs inimaginables il y a 4 ans se calculent sans soucis ni grosse chauffe (il y a un noctua dessus: cette tour fait moins de bruit que l'intel 40 threads dans la tour à côté, qui semble chauffer deux fois plus). Le meilleur matos de ma vie pour le moment et ce malgré l'overclock de ouf des pentium100, le sempron thorton (avec son cache de ouf débloquable en athlon xp, et ce cache L1 exclusif, mon dieu ! comment il explosait le calcul numérique à l'époque!) ou la radeon 9700 (~2002) sur lequel on faisait péter les premiers calculs matriciels
Surtout au prix des GPU d'aujourd'hui, quand on les trouve.
Ca se discute effectivement de faire ce genre d'install pour faire de la 3D. Et on a de la RAM à gogo et ECC. En terme d'exécution un 3990X c'est 40% de l'exécution d'une RTX 3090, mais un 3995X doit être autour de 70%.
Une futur 128 cores Zen3 devrait allègrement dépasser un GPU seul actuel.
par Un ragoteur bio de Bretagne, le Jeudi 30 Septembre 2021 à 18h08  
je confirme (comme Linus d'ailleurs) le threadripper 128 threads dans une tour standard au boulot dépote sa maman pour être poli. C'est un monstre en calcul parallélisé fortran mais aussi en monothread, le meilleur achat de mon boulot depuis 15 ans (moins de 3500€ alors qu'on payait facilement des serveurs de calculs anémiques autour des 6000€. On ne se pose plus de questions, on parallélise tous calculs en dév (blas lapack opencl) en haut niveau (un thread maitre, les autres en, workers), et les trucs inimaginables il y a 4 ans se calculent sans soucis ni grosse chauffe (il y a un noctua dessus: cette tour fait moins de bruit que l'intel 40 threads dans la tour à côté, qui semble chauffer deux fois plus). Le meilleur matos de ma vie pour le moment et ce malgré l'overclock de ouf des pentium100, le sempron thorton (avec son cache de ouf débloquable en athlon xp, et ce cache L1 exclusif, mon dieu ! comment il explosait le calcul numérique à l'époque!) ou la radeon 9700 (~2002) sur lequel on faisait péter les premiers calculs matriciels
par Pipotronator, le Jeudi 30 Septembre 2021 à 12h50  
Malgré que la société s'appelle Ampere, elle ne fait pas trop péter les watts.
par Pyvesd en Nouvelle-Aquitaine, le Jeudi 30 Septembre 2021 à 12h46  
l'ARM qui met 70% au serveur EPYC dans les tests optimisés ARM v8, ca fait mal !!
Il est grand temps qu'un bon dépoussiérage d'instructions soit opéré par les 2 acteurs du x86, voir l'abandonner au profit de cpu purement x64...

"Notez également que la solution d'AMD s'est montrée systématiquement au-dessus de celle d'Intel, quel que soit le test effectué. En même temps, difficile de le battre avec deux fois moins de cœurs?! "
128/80=1.6 et non 2 et l'AMD est toujours entre 2 et 3 fois + performant, mais bon, les décideurs IT continuent à acheter de l'Intel...