Passer au contenu

Cette intelligence artificielle pourrait simplifier la vie de millions d’analphabètes

Microsoft développe des IA plus réalistes – et qui surtout demandent moins de travail.

On vous parlait il y a quelques jours des efforts menés par Microsoft dans le registre du handicap. Son idée est plutôt simple : miser sur l’intelligence artificielle pour faire évoluer les choses et faciliter le quotidien. Pour cela, la firme a imaginé des milliers de scénarios en s’appuyant sur l’IA, allant de la fabrication du whisky jusqu’à la détection du cancer du sein. La société de Richmond multiplie donc les initiatives autour des algorithmes, la dernière en date concernant le “text-to-speech”.

Comment Microsoft optimiste le text-to-speech

Le “text-to-speech”, une méthode qui consiste à faire lire un texte par une intelligence artificielle, devient de plus en plus pertinent avec le temps. De nombreux acteurs comme Google ou Microsoft travaillent sur cette technologie pour faciliter un certain nombre d’usages – notamment pour les personnes qui ne savent pas lire. Toutefois, il faut reconnaitre qu’il y a un vrai défi autour de cette technologie lié au fait que les intelligences artificielles doivent être entraînées pendant un certain temps – et qu’elles consomment donc énormément de ressources pour obtenir un résultat à la hauteur.

Pour optimiser cette technologie,  Microsoft – en collaboration des chercheurs chinois – a mis au point une autre solution en concevant une intelligence artificielle qui puisse générer un texte réaliste et compréhensible en utilisant 200 extraits vocaux et les verbatims textuels correspondant. Cette avancée repose sur ce que l’on nomme l’apprentissage profond qui consistent plus ou moins à imiter le fonctionnement des neurones du cerveau. Ce système, particulièrement agile, permet de transformer des phrases complexes d’une façon beaucoup plus efficace. Les chercheurs ont ajouté au système un algorithme de réduction du bruit.

Selon les analyses, le résultat n’est pas encore tout à fait idéal, mais la précision et surtout l’intelligibilité sont jugés très bons à 99,84 %. En cas de succès confirmé, cela pourrait permettre de mettre le text-to-speech à la portée de n’importe qui ou presque. L’objectif est désormais de l’entraîner avec des données non corrélées. Dans tous les cas, cela peut rendre plutôt optimiste quant aux usages potentiels de ces nouvelles technologies.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech

Cliquer pour commenter
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *