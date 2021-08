En 2019, le Departement of Energy US avait signé avec Intel un contrat de 500 millions de dollars pour un superordinateur intégralement équipé de hardware des bleus et celui-ci aurait dû entrer en service en 2021. Le problème, c'est que le matériel Ponte Vecchio et Sapphire Rapids qui doit équiper les 9000 nodes d'Aurora est toujours en gestation et n'existe pas encore dans le commerce. De plus, si les Xe-HPC Ponte Vecchio ne devraient plus tarder, Intel a aussi confirmé que les puces Xeon Sapphire Rapids n'entreront pas en production avant 2022. De ce fait, le fondeur espère désormais livrer le superordinateur en 2022 et a assuré qu'il s'y tiendra cette fois-ci. Au passage, Aurora aurait été le premier superordinateur exascale aux USA, mais ce titre reviendra désormais normalement plus tard dans l'année à une autre supermachine assemblée par HPE pour l'Oak Ridge National Lab et qui sera équipée de puces AMD.

US DOE is building a new HPC as stop gap because Intel keeps delaying Aurora!



Polaris HPC is 560 nodes AMD Epyc CPUs + 4x Nvidia A100 GPUs, HPE Slingshot

46PFlops

Leak cause DOE didn't want to brief/embargo.



En attendant, pour compenser le retard d'Intel, le Departement of Energy s'est tourné vers NVIDIA et AMD pour l'installation d'un superordinateur baptisé Polaris. Il ne s'agira pas d'un remplacement, mais plutôt d'un intérim. Sur la base d'une conception Slingshot de HPE, Polaris possèdera 560 nodes, avec 4 A100 et 1 CPU EPYC par node, soit 2240 GPU de NVIDIA, pour un total de 44 PetaFLOPS en FP64 et 1,4 AI ExaFLOPS (attention, il s'agit d'une mesure différente), et une consommation de 2mW en pointe (contre 60 mW pour Aurora). Autrement dit, Polaris sera beaucoup moins puissante qu'Aurora, mais devrait tout de même arriver à se placer dans le top 10 du Top 500 du classement des superordinateurs. L'installation est déjà presque achevée et la machine sera prête à commencer son travail de recherche dès le début de 2022, avec une disponibilité élargie à partir du second trimestre.

The system will accelerate transformative scientific exploration, such as advancing cancer treatments, exploring clean energy and propelling particle collision research to discover new approaches to physics. And it will transport the ALCF into the era of exascale AI by enabling researchers to update their scientific workloads for Aurora, Argonne’s forthcoming exascale system.

Ce retard n'est évidemment pas très flatteur pour Intel et donne une fois de plus à ses concurrents l'occasion de briller, et de renforcer encore un peu leur présence sur le marché. Pour l'anecdote, Aurora aurait initialement dû exister depuis 2018 sous la forme d'un supercalculateur de 180 PetaFLOPs seulement. Mais le projet a été complètement revu suivant les retards, puis l'annulation définitive des Xeon Phi d'Intel en 2018. On peut donc dire que l'histoire se sera partiellement répétée... (Source : Tom's, Reuters, NVIDIA)