Les deepfakes font régulièrement parler d’eux et rarement en bien. Certains experts craignent même qu’un extrait vidéo trafiqué soit en mesure de venir perturber un scrutin important et pourquoi pas la prochaine élection présidentielle américaine. Ces derniers temps, les reproductions factices des voix ont également effectué de gros progrès. Elles génèrent aussi leur lot d’inquiétudes et des escrocs les utilisent déjà pour extorquer de l’argent à leurs victimes.

Certaines sociétés entendent cependant utiliser ces technologies dans une optique positive. C’est le cas de la startup LOVO basée en Californie. L’entreprise a développé un outil qui serait capable de recréer des voix de manière précise et convaincante à partir d’un court extrait audio.

La distanciation sociale, une aubaine pour le secteur ?

Concrètement, l’intelligence artificielle de LOVO basée sur l’apprentissage automatique est en mesure de créer un clone vocal. Elle procède au préalable à un repérage du ton, de la hauteur et de la vitesse de la voix pour arriver à un résultat très ressemblant.

Les applications d’une telle technologie sont infinies. Tom Lee, le co-fondateur de LOVO s’en est expliqué à Digital Trends :

Imaginez une publicité sur Spotify qui appelle chaque utilisateur par son nom. On pourrait avoir un million de variantes de la même annonce, créées en quelques clics, aucun enregistrement supplémentaire nécessaire. Imaginez des enseignants et des formateurs clonant leurs voix et transformant leurs cours en fichiers audio sans avoir à enregistrer chaque nouvelle session. Imaginez que vous préserviez la voix de votre proche et que votre haut-parleur intelligent vous parle avec cette voix.

Il faudra suivre de prêt l’évolution de cette technologie mais si celle-ci tient la promesse de ses concepteurs, cela pourrait être un vrai chambardement dans le domaine de la synthèse vocale. La période de confinement que nous connaissons pourrait d’ailleurs être une opportunité pour la startup car son outil permettrait de générer rapidement du matériel d’apprentissage en ligne ou des voix off pour des projets de production à distance.