Des nouvelles de la HBM-PIM de Samsung, en action chez Xilinx

RTX 5070 TI : 47 refs en stock Tendance stable
RTX 5090 : 51 refs en stock Tendance stable
RADEON RX 9070 : 31 refs en stock Tendance stable
RADEON RX 9070 XT : 49 refs en stock Tendance stable
RADEON RX 9060 XT : 64 refs en stock Tendance stable
RTX 5060 : 86 refs en stock Tendance stable
RTX 5060 Ti : 137 refs en stock Tendance stable
Core Ultra 5 245K : 10 refs en stock Tendance baissière
Core Ultra 7 265K : 9 refs en stock Tendance stable
Core i7-14700k : 17 refs en stock Tendance stable
Core Ultra 9 285K : 3 refs en stock Tendance stable
Tendance baissière
RTX 4060 ti : 34 refs en stock Tendance stable
Tendance stable
RTX 4070 TI SUPER : 1 ref en stock Tendance stable
Ryzen 9700X : 3 refs en stock Tendance stable
Ryzen 7700X : 3 refs en stock Tendance haussière
Ryzen 7800X3D : 10 refs en stock Tendance stable
ryzen 9800X3D : 7 refs en stock Tendance stable
Ryzen 9900X : 5 refs en stock Tendance stable
RTX 4090 : 1 ref en stock Tendance stable
RADEON RX 7700 XT : 15 refs en stock Tendance baissière
Ryzen 7950X3D : 4 refs en stock Tendance stable
PS5 Pro : 2 refs en stock Tendance stable

La réception • Actualités • Cartes graphiques

Le Process in Memory, ou PIM, est une des directions possibles pour prolonger une augmentation des performances des processeurs proche des prévisions de Moore. Dans le principe, rien de bien foufou : donner à la mémoire quelques capacités de prétraitement des informations, histoire d’accélérer la vitesse du bousin. En fait, le bénéfice est double : d’une part, le CPU se retrouve déchargé de ces opérations, permettant d’économiser quelques précieux cycles ; mais il se trouve que la structure de la mémoire permet parfois (en particulier sur la DDR) de réaliser certaines opérations plus facilement que sur processeur, comprenez par là avec moins d’énergie par des circuits moins généralistes.

Si l’idée plane depuis quelque temps dans la recherche académique, Samsung est les premiers à en avoir fait un produit disponible librement aux industriels avec la HBM-PIM, orientée IA également connue sous le nom de code de leur puce, Aquabolt XL. Cependant, depuis son annonce officielle, peu de données avaient été communiquées sur les performances... jusqu’aux Hot Chips 2021, une conférence ayant eu lieu le 22-23 août dernier. À cette occasion, la firme a montré un système intégrant cette fameuse HBM, basé sur un FPGA de chez XILINX — encore eux —, plus précisément un Virtex Ultrascale+ Alveo dédié à l’IA. En interne, les capacités de calcul de la mémoire sont pourtant limitées : addition et multiplication sur des données 16-bit, et c’est tout ! Or, vu que les réseaux de neurones ne réalisent quasiment que ces opérations, les performances sont bien au rendez-vous.

Déporter des calculs en mémoire ? Pourquoi faire ? [cliquer pour agrandir]

Réduire les mouvements de données : le B.A.-BA du PIM

Les résultats ont été sans appel : sur un réseau de neurones récurrents servant à de la reconnaissance vocale, le bousin a été 2,5 fois plus rapide et a économisé 62 % de sa consommation énergétique par rapport à une version sans PIM. Il faut dire que l’ajout des unités de calcul n’augmente que de 5,4 % la consommation totale de la puce de RAM, rendant leur Aquabolt XL intégrable exactement de la même manière que la HBM2 standard dont elle reprend les grandes lignes. Avec une intégration de masse prévue pour 2022 (les premiers exemplaires de test étant livrés en ce moment même aux partenaires), Samsung espère bien inonder le marché avant la concurrence.

En pratique, comment cela rend-il ? [cliquer pour agrandir]

Reste à voir si cela va convaincre les industriels et, pourquoi pas, arriver un jour dans des modules DDR ou des SoC de smartphone/tablettes pour toujours plus de performances ? Car une version LPDDR5 serait à l’étude, ce qui permettrait de voir la technologie débarquer pour le grand public plus tôt que prévu... (Source : IEEE Spectrum)

Un poil avant ?

Les prix des CPU Alder Lake en fuite, fuite des capitaux surtout !

Un peu plus tard ...

EVGA blâme de mauvaises soudures pour les RTX 3090 mortes sous New World

Transférer des calcul directement dans la mémoire : pourquoi pas, mais qu'est-ce que cela apporte ?

2 minutes

Sur le comptoir, au ~même sujet

	La DDR3, victime collatérale de la forte demande de HBM chez Samsung et SK Hynix
	Test • Samsung 9100 Pro (Presto + TLC 236L)
	La première génération de GDDR7 prête chez Samsung : 32 Gbit/s
	Deux nouveaux SSD Samsung en approche : le 990 Evo Plus et un mystérieux 9100 Pro
	Samsung sera bien prêt sur le 2 nm en 2025, et sur le 1,4 nm en 2027
	Samsung lance le premier dispositif hybride CXL qui combine mémoire flash et DRAM
	Samsung sur la route des NAND à 300+ couches... Et aussi sur celles à 400+ couches
	Samsung lance son SSD 990 EVO Plus, pour ceux qui en veulent plus
	Menacée par la concurrence, Samsung Electronics change sa direction
	Tout plein de couches chez Samsung et Micron
	AMD : Un partenariat renforcé avec Samsung, de nouvelles puces Ryzen 7000 mobiles et une vilai...
	Le fondateur de TSMC explique pourquoi Samsung et Intel rament

Suivez-nous sur G.Actualités

1 pauvre ragot

Les ragots sont actuellement
ouverts à tous, c'est open bar !

Changer l'ordre d'affichage des ragôts
Vous devez être identifié pour changer cette option !

	par patator_bzh, le Jeudi 02 Septembre 2021 à 19h42 Pour info en passant, en France aussi il y a des boîtes qui sont sur le PIM, par exemple UPMEM: un petit lien tout mignon (c'est pour le côté, "en europe on a rien..." )

Les prix des CPU Alder Lake en fuite, fuite des capitaux surtout !

EVGA blâme de mauvaises soudures pour les RTX 3090 mortes sous New World

Transférer des calcul directement dans la mémoire : pourquoi pas, mais qu'est-ce que cela apporte ?

Sur le comptoir, au ~même sujet

les dernières brèves, en bref, pour aller vite, toussa.

les derniers articles, pointus, précis, comme la mouette.

pour les médias du Comptoir 2006 - 2099 (ça, c'est fait)