COMPTOIR
register

AMD booste l’IA locale avec un modèle Stable Diffusion 3.0 optimisé XDNA 2 dans Amuse 3.1

AMD, toujours en collaboration avec Stability AI, a dévoilé un modèle NPU BF16 pour Stable Diffusion 3.0 Medium. L’entreprise le présente comme le premier de l’industrie spécifiquement conçu pour tirer profit de sa NPU XDNA 2 au niveau local. Depuis le Computex 2024, la marque aime à rappeler sa formule selon laquelle ce modèle BF16 Stable Diffusion combine les avantages de performance de l'INT8 avec la précision du BF16.

amd npu generation image stable diffusion

Vous aurez le prompt plus bas © AMD

Critères et fonctionnement

Pour les exigences matérielles, AMD évoque un PC équipé d’un processeur Ryzen AI série 300 ou Ryzen AI MAX+ armé d’une NPU XDNA 2 capable de délivrer au moins 50 TOPS — même le rachitique Ryzen AI 5 330 coche donc cette case. Par contre, bien que le modèle n’utilise que 9 Go de mémoire, il est aussi question d’un minimum de 24 Go de RAM pour l’ensemble du système.

Le générateur d’images à partir de texte basé sur Stable Diffusion 3.0 Medium est capable de générer des visuels personnalisables de qualité « stock », pouvant être adaptés à des usages de design ou de marketing. L’article de blog précise qu’il interprète des instructions textuelles pour générer des images en 2 MP (1024 x 1024 pixels), puis qu’il les sur-échantillonne en 4 MP (2048 x 2048 pixels).

pipeline stable diffusion amd 1

pipeline stable diffusion amd 2

La publication propose trois prompts avec les illustrations générées. Nous nous bornons aux deux utilisés pour l’image d’illustration.

Pour la canette (ligne du haut), c'est : « Photographie macro, publicité commerciale pour la marque NPU. Une canette de soda NPU aux couleurs vives avec uniquement le logo en grandes lettres "NPU". Aucun autre texte n’apparaît sur la canette, à part le logo "NPU". En arrière-plan, des fruits tranchés et des éclaboussures d’eau entourent la canette. Prise de vue en studio, grande profondeur de champ, photographie professionnelle, très détaillée. »

Pour les humains (ligne du bas), la requête est : « Plongée en contre-plongée, style cinématographique, photographie de mode pour la marque NPU. Une femme porte un maillot NPU avec le logo en grandes lettres "NPU", ainsi qu’un pantalon chino marron. L’arrière-plan est un dégradé de rouge, rose et orange, en studio. »

L’intérêt de ce modèle réside bien sûr dans son fonctionnement entièrement local. Il permet une génération d’images rapide et hors ligne.

Ce nouveau modèle est disponible dans le cadre d'Amuse 3.1 (Amuse 3.0 datait d'avril dernier), qui a été lancé concomitamment ; il réclame les derniers pilotes AMD Adrenalin Edition. Rappelons qu’Amuse, développé par Tensorstack, en est encore au stade Beta. Enfin, l’usage du modèle est soumis à la licence communautaire de Stability AI (proposé gratuitement pour les particuliers et les entreprises dont les revenus annuels sont inférieurs à 1 million de dollars).

Un poil avant ?

En cabine • MSI Strike 600

Un peu plus tard ...

La DDR6 en 2027, avec 17 600 MT/s en ligne de mire

Les 2 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !
par Un ragoteur bio du Grand Est ••, le Lundi 28 Juillet à 11h28  
L'illusttmration montre de sacrés défauts...

Entre les manches palmées et les fruits bien bien foireux, ça donne pas vraiment envie.
par Le boucher des potins embusqué, le Mercredi 23 Juillet à 06h33  
Dommage de pas avoir utilisé ce logo pour Amuse 3