Passer au contenu

Google utilise l’IA pour améliorer la qualité des appels malgré une mauvaise connexion

Google a développé une IA qui compense les parties d’une conversation audio qui sont perdues à cause du réseau. Actuellement, le modèle est capable de remplacer les syllabes qui disparaissent, mais pas les mots.

Aujourd’hui, les appels en ligne font partie de notre quotidien. Et en cette période de confinement, ces outils sont encore plus utilisés que d’habitude. Cependant, il est assez fréquent que la qualité de ces appels soit réduite à cause des problèmes de réseau qui occasionnent des pertes de « paquets » et donc des pertes de segments audio sur des appels.

Google indique, par exemple, que 99 % des appels sur son application Duo subissent ces pertes de paquets. Dans 20 % des appels, plus 3 % de la partie audio est perdue. Et pour 10 %, il y a perte de plus de 8 % de la partie audio.

Pour garantir un minimum de qualité, les services de chat audio ou vidéo doivent compenser ces pertes. Mais d’après Google, les techniques habituellement utilisées ne permettent d’avoir une continuation fluide que lorsque les pertes ne durent pas plus de 20 millisecondes. Et lorsque ces pertes ont une durée de plus de 60 millisecondes, « la parole devient robotique et répétitive, un son caractéristique qui est malheureusement familier à de nombreux appelants vocaux sur Internet », explique la firme de Mountain View.

Une IA pour améliorer la qualité des conversations sur Duo

C’est pour cette raison que Google a développé sa technologie WaveNetEQ , basée sur l’intelligence artificielle, et qui permet de compenser les pertes sur des intervalles plus longs, dans les appels sur l’application Duo. « Afin d’assurer la robustesse du modèle auprès d’un large éventail d’utilisateurs, nous avons formé WaveNetEQ sur un ensemble de données vocales contenant plus de 100 locuteurs dans 48 langues différentes, ce qui permet au modèle d’apprendre les caractéristiques de la parole humaine en général, au lieu de la propriété d’une langue spécifique », indique l’entreprise.

Mais si WaveNetEQ permet d’avoir une meilleure compensation des pertes sur les appels audio, celui-ci a tout de même ses limites. Google précise que son modèle est capable de prédire les sillages, mais pas les mots qui disparaissent à cause des pertes.

Cette nouvelle technologie, qui devrait être utile durant cette période de confinement, durant laquelle la probabilité des congestions du réseau est plus élevée, était déjà testée sur les smartphones Pixel 4 de Google, sur l’application Duo. Et cette semaine, celle-ci commencera également à être déployée sur d’autres modèles.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech

Cliquer pour commenter
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *