À l’occasion du Accelerated Data Center — un choix de nom qui n’est pas sans rappeler un certain Intel Accelerated — AMD a dévoilé sa nouvelle gamme en ce qui concerne les centres de calcul. Côté CPU, EPYC a bien entendu répondu présent, mais il y avait également du monde côté GPU, et pas que avec la récente Radeon Pro V620.

En effet, les rouges avaient gardé dans leur poche la AMD Instinct MI200, une carte pas si secrète, car de nombreuses fuites et autres annonces officielles l’avait suggérée. Au menu, une gargantuesque carte remplie de transistors à y faire tomber les cheveux de Tomiche : pas moins de 58 milliards en tout, utilisant le procédé 6 nm de chez TSMC, répartis sur deux dies formant un Multi-Chip-Module. Pour relier ces deux gus, AMD a sorti la glu infinity fabric habituelle, offrant dans cette déclinaison une vitesse de transfert (inter-die, donc) de 400 Gio/s. Pour le stockage des variables, pas de souci : les MI200 intègrent la bagatelle de 128 Gio de HBM2e étalés sur 8 stacks, de quoi largement voir venir.

Architecturalement, la carte descend de CDNA, le penchant calcul scientifique/HPC de RDNA, tous deux étant initialement issus de la même base VEGA. Avec cette nouvelle itération, le ratio de calcul en double précision par rapport à la simple passe en 1:1, avec support du float16, bfloat16, int4 et int8 à un débit 4 fois supérieur à la simple précision : de quoi combler les amateurs d’apprentissage statistique ! De plus, et tout comme chez les verts, cette série possède également des unités de calcul matriciel, néanmoins leur niveau de développement reste un cran en dessous de la concurrence, notamment par l’absence de support de la sparsité.

Tout cela est bien beau, mais quels modèles peuplent cette série en pratique ? Hé bien, deux seuls nous font cet honneur : la MI 250X et la MI250 :

Caractéristique MI250 MI250X CU/SP 208/13 312 220/14 080 Puissance FP32 (idem en FP64) 45,3 TFLOPS 47, 9 TFLOPS Puissance FP32 (idem en FP64), matriciel 90, 5 TFLOPS 95, 7 TFLOPS Puissance FP16 (idem en BF16, INT4, INT8) 361,2 T(FL)OPS 383 T(FL)OPS Mémoire 128 Gio HBM2e @ 3,2 Tio/sec

Pas d’annonce de prix officiel, mais nul doute que cela va piquer ! Au vu de la cible, il y a peu de chance que cette carte se retrouve victime des scalpers, mais il y a fort à parier que la pénurie ne rendra pas pour autant les choses simples, surtout sachant que le supercalculateur Frontier, américain, compte bien réserver ses unités afin de dépasse l’ExaFLOPS de puissance brute. Reste à voir ce que ces améliorations orientées pros vont donner sur les segments de produits plus accessibles !