COMPTOIR
  
register

×

Une IA entraînée par une IA lancée sur Quake III
google deepmind agent quake 3 t

Après le très médiatisé tournoi de Go de l'IA de Google - enfin, Alphabet - nommée DeepMind ne s'en est pas arrêté là. Nous avions vu il y a quelques années déjà une branche qui avait évolué dans le domaine de la reconnaissance d'images, c'est désormais d'un retour vers les jeux dont il est question.

 

Dans un article du prestigieux journal Science, l'IA est parvenue à surpasser des humains dans Quake III Arena en mode capture de drapeau, et ce grâce à un apprentissage par renforcement, dans lequel la machine a du se gérer toute seule. Point de jeu de données indiquant des stratégies gagnantes, le programme a évolué tout seul - à la manière d'un joueur novice nous diriez-vous. Au départ, les agents effectuaient des actions au hasard, puis se sont spécialisés en fonction des objectifs atteints lors d'entrainements IA vs IA, lesdits objectifs étant évalués par un réseau de neurones récurent, qui permet de prendre en compte les signaux de victoire ou de défaite accumulés tout au long de la partie. L'intérêt de la capture de drapeau est alors clair : faciliter l'entraînement. Les chercheurs ont en effet remarqué que le simple score de mort ou de victoires est trop peu clair pour réussir à faire évoluer significativement le programme, et pour cause : il est plus difficile en évoluant aléatoirement de tuer quelqu'un que de récupérer le drapeau ! Pour éviter tout risque de triche, l'équipe gérée par l'ordinateur utilise des agents à la place des joueurs : cloisonnés les uns des autres, aucune donnée ne peut communiquer, histoire de se rapprocher un maximum de l'équivalent humain.

 

google deepmind agent quake 3 t [cliquer pour agrandir]

Campeur noob, cyka blyat

 

Certaines techniques nommées métaoptimisations ont également été employées. Assez simple dans leur principe, elles consistent à forcer une sélection des meilleurs agents toutes les milliers d’entraînements, en remplaçant ceux dont les chances de victoires sont inférieures à 70% par le meilleur agent du groupe.

 

La méthode a semble-t-il porté ses fruits, car l'IA a réussi a atteindre un niveau comparable aux joueurs pros et même les battre sur une carte connue. Néanmoins, sur une carte qu'ils n'avaient jamais vue auparavant, les robots n'ont pas sû s'adapter aux humains, qui eux ont décidé de se concentrer sur les points faibles du parcours des IA. Bientôt dans nos consoles pour gérer les adversaires des aventures solos ? (Source : IEEE Spectrum)

 

quake iiia cdh

Vers un nouveau remake ?

Un poil avant ?

Un nouveau pilote Geforce vient de tomber

Un peu plus tard ...

Gamotron • 1 + 1 = 11, et ça c'est beau !

Après les échecs et le Go, l'IA DeepMind de Google approche le terrain de jeu en ligne. Parés ?

temps de concentration afin de cerner l'ensemble des subtilités de ce billet à vue de nez disons heuu moins de 2 minutes

Sur le comptoir, au ~même sujet

 
 
 
 
 
 
 
 
 
 
 
 



Suivez-nous sur G.Actualités
Les 24 ragots
Les ragots sont actuellement
ouverts à tous, c'est open bar !