• DX11, D3D 11.3 & 12 / VXGI

d3d 11.3 - volume tiled resources [cliquer pour agrandir]d3d 11.3 - conservative rasterization [cliquer pour agrandir]

Les dernières coquetteries D3D 11.3 supportées - cliquez pour agrandir

 

Côté fonctionnalités, la seconde révision de Maxwell apporte cette fois le support complet de DirectX 11, y compris les niveaux D3D 11.1, 11.2 et à priori le 11.3 qui reprendra les "features" apportées par DX12. Concernant ce dernier, NVIDIA annonce que toutes ses puces depuis Fermi le supporteront, à quel niveau de fonctionnalités c'est une autre histoire puisqu'en l'absence de publication de la dite API, il est difficile d'en tirer des certitudes absolues pour le moment. Lors du lancement des cartes Maxwell gen2 à la presse, Microsoft a présenté à ce sujet certaines nouveautés parmi lesquelles notamment :

 

Conservative Rasterization, technique de rastérisation plus précise permettant de savoir si un polygone recouvre un pixel, en testant aux quatre coins plutôt qu'en son centre.

Rasterizer Ordered Views (ROVs), qui permet aux développeurs de maitriser l'ordre dans lequel les objets d'un scène sont rasterisés, et donc l'ordre dans lequel ils sont rendus, sans intervention du processeur pour effectuer ce tri. Une alternative aux UAVs pour le rendu des scènes.

Volume Tiled Resources (VTRs), supports directement tirés des travaux ayant abouti aux Tiled Ressources implémentées dans D3D 11.2, aussi connu sous le nom Megatexture chez ID. Ils gagnent ici une dimension supplémentaire, notamment dans l'idée de les utiliser avec les voxels ou volumetric pixels.

 

Ces fonctionnalités sont d'ores et déjà intégralement prises en charge par Maxwell, tout comme d'autres telles que VXGI (Voxel Global Illumination), une technique d'éclairage avancée extremement prometteuse, permettant de s'approcher encore un peu plus du photoréalisme. Si on est pas encore au niveau du Ray Tracing, le VXGI permet de gérer l'éclairage indirect d'un objet par la relfexion naturelle de la lumière issue de leur environnement, sources comme objets. De la global illumination en temps réel en somme, rendue possible dans une vaste gamme de scénarios grace au découpage des objets en Voxels (= pixels en 3D donc) couplé à du Path tracing et du Cone tracing, comme Mr. Nvidia pourra vous l'expliquer ici


Déja croisée publiquement lors du GDC 2012 et issue d'un travail de longue haleine, la technologie devient avec l'arrivée de Maxwell gen2 une quasi réalité sur nos écrans grace à un support matériel permettant d'accélérer le traitement du VXGI, en particulier sur la création des grilles de voxels. Les algorithmes logiciels de part leur nature seront du coup compatibles avec une large gamme de GPU, tout comme leur conception permettra de configurer aisément leur qualité de rendu en jouant sur le nombre de voxels générés dans chaque grille. La première implémentation concrète devrait être vue au sein de l'Unreal Engine 4, on peut s'attendre à une adoption massive par la plupart des poids lourds de l'industrie, via l'évolution de nombreux moteurs 3D à l'avenir.

 

Démo VXGI Apollo11 [cliquer pour agrandir]

La démo Apollo11 illustrant le rendu VXGI (c'est con, vous ne pouvez pas le voir animé) - Cliquez pour agrandir

Démo VXGI Apollo11 [cliquer pour agrandir]

A droite, le célèbre cliché d'Aldrin sortant du module lunaire. A gauche, la même scène en rendu temps réel VXGI.

 

• Quoi de neuf côté affichage et encodage ?

Le moteur d'affichage évolue lui aussi, on reste cantonné à la gestion simultanée de 4 écrans avec une carte mais la prise en charge d'un DVI DL, de 3 DisplayPorts 1.2 et d'un HDMI 2.0 fera plaisir aux amateurs de multi-écrans ou de grosses définitions (5120x3200 max.). L'encodeur maison NVENC voit ses capacités boostées (2.5x) permettant en H.264 l'enregistrement de vidéo en 4K@60fps via ShadowPlay et prend en charge à présent le H.265. Point suprenant, ce dernier ne dispose par contre pas d'un décodeur dédié, NVIDIA utilisant pour cette opération un mix du décodeur H.264 et des unités de calcul du GPU, une solution bien moins économe en énergie... A priori le décodeur était bien prévu à l'origine, mais un bug a obligé le caméléon à le désactiver au dernier moment. G-Sync est bien entendu de la partie et nous avons eu l'occasion de tester brièvement cette technologie avec la GTX 980 couplée à un Asus ROG Switch PG278Q et le moins que l'on puisse dire, c'est que l'apport de fluidité est impressionnant pour les jeux très gourmands graphiquement !

 

Activation G-Sync [cliquer pour agrandir]G-Sync [cliquer pour agrandir]

La mise en oeuvre de G-Sync en 2 clics

 

• Un meilleur AA et une super résolution !

Enfin, NVIDIA met en avant plusieurs technologies d'amélioration du rendu. La première est le MFAA, une technique d'anti-aliasing avec des échantillons non plus fixes mais programmables via le support hardware du "multi-pixel programmable sampling" au niveau des moteurs de rastérisation. En couplant cette fonctionnalité avec une composante temporelle, NVIDIA indique pouvoir proposer les performances d'un MSAA 4x avec la qualité du 8x (ou 4x pour le coût du 2X). Toujours en cours de développement cette fonctionnalité devrait également être proposée aux possesseurs des premières puces Maxwell (750 Ti, 850/860M). 

 

MFAA

MFAA : un nouvel AA à venir... Mais dans un prochain pilote !

 

La seconde est une technique de rendu nommée DSR pour Dynamic Super Resolution. En pratique il s'agit de calculer l'image dans une définition supérieure à celle de l'afficheur et de réaliser un downsampling pour afficher l'image sur le moniteur et ce par le biais d'un filtre Gaussien élaboré pour limiter des artefacts qui pourraient survenir lors de cette opération. Comme on peut s'en douter, le coût d'une telle opération est similaire à celui d'un rendu en pleine résolution. 

 

Le caméléon insiste sur le fait que bien que le principe soit similaire (rendu dans une définition supérieure à celle de l'afficheur), le SSAA (Super Sampling Anti-aliasing) ne permet pas au jeu de "savoir" qu'il sera "rendu" à une définition supérieure puisque cette étape est réalisée dans un second temps par le GPU ce qui peut poser problème avec les moteurs de jeux récents utilisant des effets post rendu. Le DSR n'aurait pas ce souci puisque le jeu utilise en fait dès le départ la définition plus élevée et le GPU réalise ensuite le downsampling pour l'adapter au moniteur. La mise en oeuvre est très simple via l'option introduite avec les pilotes de la génération 343 pour les puces Maxwell (et devrait être étendue à d'autres GPU à l'avenir) :

 

Activation DSR

Activation du DSR

 

On choisit d'abord le facteur d'upscaling (4x max.) puis la valeur du lissage au travers du slide dédié au filtrage.

 

Facteur dupsamplingFiltres Gaussien

Réglages DSR

 

Voici un exemple de résultats fournis par le caméléon comparant la qualité d'image avec MSAA 4X ou avec DSR 4X :

 

BF4 MSAA [cliquer pour agrandir]BF4 DSR [cliquer pour agrandir]

A gauche MSAA, à droite DSR - Cliquer pour agrandir

 

• VR, gameworks, et le reste... Mais il est tard, foutu NDA à 4h30 !

nvidia_gameworks_092014.jpg

Les bibliothèques gameworks s'étoffent... Même si elles restent fermées , hélas !

 

nvidia gameworks turf effects [cliquer pour agrandir]nvidia gameworks flex [cliquer pour agrandir]

De la belle herbe et des liquides crédibles

 

D'autres technologies arrivent avec cette 10e génération de GPU : Direct VR, ou la promesse de NVIDIA de réduire à minima les latences de rendu vers un périphérique VR type Oculus Rift, avec notamment des gains d'une dizaine de millisecondes (pour une latence "ordinaire" de 50ms en tout) des latences induites par l'OS et le pilote dans le traitement des instructions de rendu, ou encore des astuces de prédictions de calculs (Asynchronous Warp, dont le principe et d'obtenir la position de la tête de l'utilisateur au plus prêt du rendu final d'une frame, pour appliquer une distorsion à cette dernière et obtenir un rendu quasi immédiat dès la position du casque acquise. Oui cela relève de la bidouille, mais cela pourrait drastiquement faire baisser les latences de rendu). Les librairies Visual FX ne sont pas en reste et accueillent de nouveaux modules déités aux rendus des herbages ou des différents types de liquides... De jolies promesses que nous suivrons de près. Passons à présent aux spécifications des premières cartes lancées avec ce GM204 page suivante.




Sur le comptoir, au ~même sujet

 
 
 
 
 
 
 
 
 
 
 
 

Les 223 ragots
Les ragots sont actuellement
Verrouillageouverts aux ragoteurs logués