Des chercheurs de l’université d’Oxford ont fait regarder en boucle les actualités de la BBC, puis ils ont mis en mode silencieux les programmes diffusés et à la grande surprise de tout le monde, DeepMind est nettement plus fiable qu’un humain pour lire sur les lèvres. L’intelligence artificielle est presque deux fois plus performante qu’un expert en lecture sur les lèvres.
L’IA est plus performante qu’un expert de la lecture sur les lèvres
L’expert en lecture sur les lèvres n’a obtenu qu’un taux de mots correctement lus de 23,8%, alors que l’intelligence artificielle a réussi à atteindre 46,9%. Une nouvelle victoire écrasante de la machine sur l’homme, qui fait déjà polémique car certains affirment que l’intelligence artificielle peut puiser dans sa base de données pour affiner ses lectures, mais comme dans toutes compétitions, chacun utilisent les armes à sa disposition.
DeepMind a en effet été alimenté au préalable par 5000 heures de vidéo de six programmes différents de la chaîne BBC, soit l’équivalent de 118.000 phrases prononcées comme base de départ, le réseau neuronal de l’intelligence artificielle a fait le reste. On imagine déjà les applications possibles de ces technologies, non seulement pour les personnes sourdes et muette, via un synthétiseur vocal, mais pas seulement…
Il est en effet possible d’imaginer des systèmes de vidéosurveillance intelligents ou d’améliorer certaines fonctionnalités dans des solutions domotiques.
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.