Une intelligence artificielle a appris à jouer à “Mario Bros” seule, grâce à sa curiosité

Vous ne vous souvenez sans doute pas de votre toute première partie de Mario, lorsque vous ne saviez pas ce qu’il fallait faire, ce qui était dangereux pour votre plombier ou au contraire ce qui était bon pour votre score. Pourtant, aujourd’hui vous savez jouer ! Une intelligence artificielle a suivi la même méthode d’apprentissage…

Un chercheur californien a mis au point une intelligence artificielle qui a su apprendre toute seule à jouer à Mario, sans que personne ne l’aide, en utilisant uniquement les armes dont elle disposait : la curiosité, la déduction et de la mémoire. En réalité, tout ce qui a fait que vous, en tant qu’humain, vous savez également jouer à Mario. L’IA ne joue pas parce qu’on lui a demandé, mais parce qu’elle est poussée à l’exploration par sa curiosité naturelle !

L’IA veut jouer par curiosité et non par obligation

Habituellement, les intelligences artificielles disposent de programmation pour réaliser une tâche et elles n’ont pas réellement appris à jouer. Dans le jeu Mario, une intelligence artificielle serait programmée pour ramasser les pièces par exemple, pour éviter les ennemis, pour sauter au-dessus d’un trou, etc. mais en réalité elle ne saurait pas vraiment jouer.

Dans le cas de l’intelligence artificielle dont nous parlons, créée par Deepak Pathak, un scientifique de l’Université Berkely en Californie, la machine a été capable d’explorer seule, de tester des solutions, de faire des déductions, d’utiliser sa curiosité, afin de déterminer elle-même les règles du jeu et passer les niveaux de Mario. Il s’agit d’une vraie prouesse, car la machine s’est basée sur des « inconnues » pour bâtir un raisonnement au fur et à mesure de ses découvertes. Mieux, cette découverte est en soi une récompense pour motiver l’intelligence artificielle à poursuivre sa quête de l’inconnu, comme le ferait un joueur.

« La contribution principale de mon travail est de montrer qu’une motivation intrinsèque motivée par la curiosité permet au programme d’apprendre, même lorsque qu’il n’y a pas de récompenses » explique Deepak Pathak.

Une intelligence artificielle qui se comporte comme un joueur humain

L’IA de Deepak Pathak se comporte donc nettement plus comme un vrai joueur humain, même si pour le moment l’IA se retrouve confrontée à un obstacle. En effet, si cette dernière se retrouve bloquée ou meurt plusieurs fois de la même manière, elle cesse de tenter sa chance, un peu comme le ferait un enfant qui n’arrive pas à terminer un niveau et passe à autre chose. En moyenne, cette intelligence artificielle n’a couvert que 30% du jeu. Deepak Pathak devra donc apprendre d’autres sentiments bien humains à son IA : la persévérance et la prise de risque pour espérer finir le jeu.

Même si ce type de recherches sont fascinantes car progressivement les machines sont de moins en moins programmées par l’homme et peuvent apprendre par elles-même, il n’en reste pas moins que des années de science fiction à la télé, laissent constamment une question existentielle dans l’esprit : et si un jour ce genre de travaux permettait à une intelligence artificielle de s’émanciper de l’homme ?


Nos dernières vidéos

2 commentaires

Répondre

Send this to a friend