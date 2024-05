Dans le cadre de l'ISC High Performance 2024, Intel a annoncé que le supercalculateur Aurora – conçu en collaboration avec Argonne National Laboratory et HPE (Hewlett Packard Enterprise) – avait enfin franchi la barrière de l'exascale ; qu'en outre, il s’imposait désormais comme le système d'IA le plus rapide au monde. Mais pour le moment, il donc se contenter de la deuxième place dans la liste Top500. Celle-ci reste dominée par le supercalculateur Frontier équipé de composants AMD.

Aurora, un projet amorcé il y a une dizaine d’années

La genèse d’Aurora remonte à 2013. À l’époque, le DoE (United States Department of Energy) exposait son souhait de se doter d’un supercalculateur plus puissant. Le projet Aurora, d’abord estimé à 180 petaFLOPS, a été officialisé en 2015 et devait être achevé en 2018.

Un an avant cette échéance, Intel reportait le lancement d’Aurora à 2021 ; en contrepartie, l’entreprise promettait 1 exaFLOPS. Elle revendiquait donc la réalisation du premier supercalculateur exaflopique aux États-Unis. Un nouveau report, acté en octobre 2020, était cependant venu casser cette ambition ; pas échaudée, un an plus tard, Intel clamait que sa réalisation dépasserait les 2 exaFLOPS. La société a finalement terminé l’installation en juin 2023.

Aurora a fait son entrée dans le classement Top500 de novembre dernier. Il affichait alors un Rmax de 585 PFlop/s ; une valeur pas au niveau de celle promise et bien inférieure à celle atteinte par Frontier (1194 PFLops/s).

Néanmoins, la publication précisait : « Le nouveau système Aurora de l'Argonne Leadership Computing Facility dans l'Illinois, aux États-Unis, est entré dans la liste à la deuxième place - précédemment occupée par Fugaku - avec un score HPL de 585,34 PFlop/s. Cela dit, il est important de noter que les chiffres d'Aurora ont été soumis avec une mesure portant sur la moitié du système final prévu. Aurora est actuellement en cours de mise en service et devrait dépasser Frontier avec une performance de pointe de 2 EFlop/s lorsqu'il sera terminé. »

En effet, Aurora est, sur le papier, un système constitué de 166 racks avec 10 624 nœuds de calcul. Ceux-ci comptent 21 248 processeurs Intel Xeon CPU Max Series et 63 744 GPU Intel Data Center Max Series. Au moment de la soumission, le supercalculateur n’exploitait que la moitié de ses composants. Il a aujourd’hui 9234 de ses 10 624 nœuds actifs, soit 87 % de ses capacités totales.

Le Rmax d’Aurora culmine désormais à 1012 PFLops/s ; celui de Frontier à 1206 PFLops/s (ces scores s’améliorent au gré des optimisations).

Cependant, Aurora a pris la première place dans le benchmark de précision mixte HPL-MxP centré sur l'IA. Cela permet à Intel de revendiquer le titre de supercalculateur IA le plus rapide au monde, avec 10,6 ExaFLOPS de performance.

Pour battre Frontier dans le classement Top500 basé sur le benchmark High-Performance Linpack, Aurora aura besoin de davantage d’optimisations logicielles. En effet, en se basant sur une mise à l’échelle linéaire des performances, l’activation des 13 % de capacité restante ne suffira pas à devancer le supercalculateur AMD.

Notez qu’Aurora devance déjà Frontier en Rpeak (1980 vs 1714 PFLops/s) et que les 2 exaFLOPS évoqués par Intel s'appliquent, a priori, à cette valeur. Toutefois, comme en témoigne la hiérarchie actuelle, les supercalculateurs sont évalués en fonction de leurs performances Rmax. Notre confrère de TH.US a contacté un représentant de l’ANL au sujet de ce classement. Ce dernier a confirmé qu’Intel avait l’objectif contractuel de rendre Aurora plus performant que Frontier, sans toutefois être explicite sur l’indice choisi (Rpeak / Rmax).

Top 5 Top500 juin 2024

Quoi qu’il en soit, en matière d’IA, Intel revendique désormais le leadership : Aurora se classe premier dans le benchmark de précision mixte HPL-MxP avec 10,6 exaFLOPS de performance AI, avec 89 % du système actif. Précisons que ce benchmark donne la priorité à une précision plus faible (FP32 et inférieure) que le benchmark Linpack utilisé pour le classement Top500 (FP64). Quant au test HPCG (High Performance Conjugate Gradients), Aurora y prend la troisième place avec seulement 38,5 % du système actif.

Top 5 HPCG juin 2024

Concrètement, comme l'illustre le classement de référence Top500, le FP64 sert toujours de mètre-étalon pour mesurer la capacité de calcul des supercalculateurs. Cependant, un nombre croissant d’applications scientifiques / de recherche exploitent les charges de travail IA.

Ainsi, dans son communiqué de presse, Intel précise :

« Conçu dès le départ comme un système centré sur l'IA, Aurora permettra aux chercheurs d'exploiter des modèles d'IA génératifs pour accélérer la découverte scientifique. Des progrès significatifs ont été réalisés dans les premières recherches d'Argonne basées sur l'IA. Parmi les réussites, citons la cartographie des 80 milliards de neurones du cerveau humain, la physique des particules à haute énergie améliorée par l'apprentissage profond, et la conception et la découverte de médicaments accélérées par l'apprentissage automatique, entre autres. »

Pour finir, Aurora se trouve à la 42e place dans le dernier classement, le Green500 – classement qui distingue les supercalculateurs selon leur efficacité énergétique. Avec sa puissance de 39 kW et son efficacité de 26 GFlops / watts, il est à la fois plus énergivore et moins efficace que Frontier (23 KW ; 53 Gflops / watts), lequel se situe à 13e position. Là encore, gardez à l'esprit que l'optimisation d'un supercalculateur prend des mois, voire des années. Le leader du Green500 est Jedi, avec son efficacité de 73 GFlops / watts (mais une capacité de calcul incomparable avec celle des deux mastodontes susmentionnés).

Top 5 Green500 juin 2024