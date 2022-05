Que serait une présentation donnée par un grand nom de l’informatique en 2022 sans sa partie dédiée à l’IA ? Pas grand-chose, et c’est bien pour cela qu’Intel a réservé une partie spécialement dédiée à Habana’s Lab, dernier rachat des bleus dans la série des accélérateurs haute performance de machine learning. Bien évidemment, ce lancement tient place au sein de la conférence Intel VisiON, auprès des autres produits (plus ou moins) classiques de la firme, CPU et GPU.

Dédiés à l’entrainement de réseaux de neurones et l’inférence sauce costaude, c’est-à-dire des tâches bien lourdes plutôt pour serveurs, ses produits phares sont actuellement les puces Gaudi et Goya, en 16 nm de chez TSMC. Hé bien, dites bienvenues aux très originales Gaudi2 et Greco, basées cette fois-ci sur du 7 nm… toujours chez TSMC — bien que les versions suivantes devraient sortir directement des fonderies des bleus.

Chez Intel, on vous présente la puce et on vous la re-montre encore après tellement qu’elle est trop trop bien !

Sous le capot du Gaudi2, l’architecture n’évolue quasiment pas, si ce n’est que le nombre d’unités de calcul bondit pour passer de 8 Tensor Processor Cores (qui n’ont rien à voir avec ceux de NVIDIA…) à 24. Rajoutez également le support du FP8, pas moins de 96 Gio de HBM2e ainsi que 48 Mégots de mémoire cache sur le die, et vous voilà paré ! Selon la firme, le gain face à une NVIDIA A100 (également en 7 nm) serait d’un facteur 2, ce qui semble raisonnable étant donné le caractère généraliste d’un CPU par rapport au design optimisé pour le machine learning dont il est question ici. Côté logiciel, c’est à la suite unifiée OneAPI d’opérer, permettant de changer d’accélérateur de manière quasi transparente (comprendre « sans changement majeur du code ») entre les divers accélérateurs de la firme (CPU, GPU et Gaudi).

Quant à Greco, les informations sont bien plus éparses : tout juste sait-on que le bousin est également gravé en 7 nm TSMC et a abaissé son TDP de 200 W à 75 W grâce à cet avancement technologique. Prévu pour l’inférence, c’est-à-dire l’application d’un modèle d’IA déjà entraîné, Greco supporte en outre le décodage matériel de différents formats de média : HEVC, H.264, JPEG et P-JPEG, tout en autorisant l’exécution de réseau à base de Bfloat 16, FP16, INT8/UINT8, ainsi que INT4/UINT4.