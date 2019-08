L’intelligence artificielle poursuit sa recherche et développement (R&D), au sein de Google. Des fonctionnalités telles que Smart Compose ou le nouveau correcteur d’orthographe de Gmail utilisent une forme d’IA dans leurs logiciels, et d’autres outils reposant sur le même principe devraient arriver à l’avenir.

C’est notamment le cas de la reconnaissance du langage des signes. L’équipe de recherche en intelligence artificielle de Google confectionne actuellement un outil fonctionnant via un simple smartphone, permettant de détecter les mains et d’en traduire leurs signes. Une fonctionnalité qui n’est pas nouvelle, mais à laquelle ni SignAll, ni Kintrans (les logiciels développant un outil équivalent), n’ont pu passer de leur support sur ordinateur au support d’un simple smartphone.

Une intelligence artificielle basée sur plus de 30 000 images

Google a donc fait appel à un programme d’intelligence artificielle pour pouvoir arriver à développer un logiciel compétent et reconnaissant tous les types de main et dans toutes les positions.

La technologie a été configurée grâce à plus de 30 000 images de mains dans différentes poses et sous différents éclairages. Les développeurs ont sélectionné – à partir de cette base de données – 21 points de référence de la main, que le logiciel devra détecter. Ensuite, il ne suffira plus que le programme visualise le signe montré à la caméra, et le comparera via l’intelligence artificielle à tous les autres signes de sa base de données.

Avec plusieurs millions de personnes utilisant le langage des signes comme moyen d’expression, les recherches de l’équipe de Google pourraient clairement se présenter d’utilité publique. Jusqu’à maintenant, la tâche restait complexe à mettre en place, tant la reconnaissance des signes sur une main peut être gênée par le fait que « les mains se bouchent souvent ou se ferment et manquent de motifs de contraste élevé », relatait Tech Crunch en s’appuyant sur un billet des chercheurs de Google intégrés au programme.

Google fait face à la difficile traduction du langage des signes

La firme de Montain View a choisi de simplifier au plus le nombre de données utilisées pour comprendre un signe effectué. La raison se trouve dans la rapidité d’exécution des gestes, contraignant le logiciel à traiter un nombre d’informations important en un temps record.

En arrivant à faire migrer un logiciel auparavant disponible que sur des ordinateurs puissants, les équipes de Google ont déjà fait un bond en avant. Mais des limites se présenteront tout de même à eux. Il en reste en effet que le langage des signes s’exprime également avec les expressions du visage. Un point sur lequel le programme d’intelligence artificielle est encore incompétent.

Désormais, l’équipe de recherche devra donc agrandir la compréhension de son logiciel à ce challenge du visage couplé aux mains. Pour ce faire, le programme développé est d’ores et déjà disponible en open source. Cela pourra être utile pour inviter d’autres sociétés à travailler sur la technologie. Le choix « aboutira à une émergence de cas d’utilisation créatifs, stimulant de nouvelles applications et de nouvelles voies de recherche », confiait l’équipe sur son blog.