Avec CDNA et CDNA2, AMD a amorcé l’évolution « professionnelle » de son architecture GCN, par opposition à RDNA, son penchant gaming. Or, dans le domaine, le machine learning est sacrément à la mode, et ce dernier se base essentiellement sur du calcul matriciel pour son caractère intelligent. NVIDIA, en leader des accélérateurs de cette famille, l’a bien compris et intègre des tensors core dans ses cartes depuis 3 générations. En revanche, chez les rouges, si des frameworks existent pour accélérer efficacement ces opérations, des unités dédiées ne sont pas encore présentes sur le segment gaming (par contre, CDNA en est pourvu)… pour le moment.

Car un petit twittos s’est rendu compte que LLVM — l’infrastructure de compilation reprise entre autres par Apple, également connue par son front-end C clang — a ajouté l’instruction WMMA : Wave Matrix Multiply-Accumulate, soit une multiplication-accumulation par vague. Comprenez, de quoi répartir astucieusement les calculs matriciels sur GPU, un indice fort de la présence d’unités dédiées sur les générations à venir. Rajoutez que les cartes ciblées sont les GFX11, le nom de code de RDNA3, et voilà une sacrée fuite ! Au passage, la chose est supportée dans la dernière mise à jour de rocWMMA : une API C++ permettant, justement, de déporter simplement les calculs matriciels sur GPU à condition de posséder une MI-100 (et une MI-200 pour de la FP64). Selon ce code, les cartes rouges supporteraient des matrices en 16 x 16 x 16, sur les formats de données FP16 et BF16 : autrement dit, le standard en 2022.

Au niveau de l’intérêt d’unités dédiées, pas de surprise : le FSR pourrait fortement en bénéficier (qu’il utilise du machine learning ou non, d’ailleurs, tant les algorithmes liés aux images sont friands de matrices), et nous pourrions même imaginer dans nos rêves les plus fous des adaptations du DLSS aux cartes de Lisa Su, à la manière du G-Sync finalement compatible Free Sync après quelques années. Bref, rendez-vous dans les mois qui suivent pour des caractéristiques plus précises ? (Source : VideoCardz)