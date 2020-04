Son nom est Agent57. DeepMind, la filiale de Google dédiée à l’intelligence artificielle, vient de développer une IA qui a appris à jouer à 57 jeux vidéo d’arcade Atari. Pour ce faire, l’algorithme s’appuie sur le deep reinforcement learning (apprentissage par renforcement profond Ndlr) qui lui permet de faire mieux que la plupart des humains.

L’IA parvient même à battre ses homologues qui étaient en difficulté sur certains jeux par le passé. L’exploit est de taille car ces derniers nécessitent d’adopter des stratégies très différentes selon les cas et donc de disposer d’une réelle capacité d’adaptation.

Une belle avancée même si l’IA reste perfectible

Pour réaliser cette prouesse, les chercheurs se sont appuyés sur leurs travaux antérieurs. Deep-Q était déjà venu à bout de plusieurs jeux Atari pour la première fois en 2012. Comme le souligne le MIT Technology Review, l’IA dispose d’une forme de mémoire qui lui permet de baser ses décisions sur des éléments qu’elle a déjà vus par le passé.

Ce résultat est particulièrement important car les systèmes d’IA actuels qui fonctionnent avec le deep learning manquent souvent de polyvalence. On connaît tous les exploits d’AlphaGo qui excelle en jeu de go et s’avère aujourd’hui quasiment invincible pour ses adversaires humains. Pour autant, l’algorithme est ultra spécialisé dans cette discipline mais pas ou peu opérationnel dans d’autres. Le développement d’une IA capable d’effectuer plusieurs tâches est donc une très bonne nouvelle.

Il reste cependant beaucoup de chemin à parcourir pour Agent57, de l’aveu même de ses concepteurs. Ils prévoient notamment de réduire la quantité de calcul dont l’IA a besoin pour fonctionner. Cette dernière est gigantesque et elle ne peut d’ailleurs apprendre à jouer qu’à un seul jeu à la fois. Ils souhaitent aussi améliorer l’algorithme pour certains jeux parmi les plus simples de la collection, auxquels d’autres systèmes beaucoup moins aboutis obtiennent de meilleurs résultats.