Passer au contenu

Sur les smartphones Google Pixel, la dictée vocale fonctionne sans Internet

Utiliser la reconnaissance vocale sans connexion internet, c’est possible sur les smartphones Google Pixel. Mais pour le moment, la fonctionnalité est uniquement disponible en anglais.

Aujourd’hui, la voix est l’un des principaux moyens que nous utilisons pour interagir avec la technologie, en particulier grâce aux enceintes connectées et grâce aux assistants numériques. Mais les systèmes de reconnaissance vocale sont encore loin d’être parfaits. S’ils sont de plus en plus précis, ils requièrent, le plus souvent, une connexion à Internet pour fonctionner correctement côté serveur.

Les avancées présentées par Google cette semaine pourraient néanmoins changer cela. En effet, la firme a développé un système de reconnaissance vocale qui fonctionne en local sur l’appareil de l’utilisateur, et qui ne requiert pas de connexion à Internet.

Pour le moment, ce dispositif ne sera utilisé que pour la dictée vocale, sur le clavier Gboard de Google, sur les smartphones Pixel. De plus, seulement l’anglais américain est supporté.

Néanmoins, Google espère que sa nouvelle technique pourra être adoptée rapidement par d’autres applis, et pour d’autres langues.

« Compte tenu des tendances du secteur et de la convergence des améliorations apportées au matériel spécialisé et aux algorithmes, nous espérons que les techniques présentées ici pourront bientôt être adoptées dans un plus grand nombre de langues et dans des domaines d’application plus vastes », explique Johan Schalkwyk, un employé de Google issu de l’unité dédiée aux interfaces vocales.

La dictée vocale hors-ligne résout beaucoup de problèmes

En effet, cela peut réduire la latence liée à une mauvaise connexion internet. Et grâce à cette avancée, la reconnaissance vocale est plus disponible puisque l’utilisateur n’a pas besoin d’une connexion Wifi ou de données mobiles pour s’en servir.

Enfin, grâce à la nouvelle technique, moins de données pourraient envoyées aux serveurs de la société.

Afin de réaliser cet exploit, Google a utilisé une technologie appelée Recurrent Neural Network Transducers (RNN-T). Johan Schalkwyk explique à ce sujet : « Le modèle fonctionne au niveau du caractère. Ainsi, lorsque vous parlez, il affiche les mots caractère par caractère, comme si quelqu’un tapait ce que vous dites en temps réel et exactement comme vous le souhaitiez avec un système de dictée au clavier ».

Google a également eu recours à de nouvelles techniques de compression, pour que son modèle stocké en local ne pèse que 80 Mo.

Source

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Youtube
Youtube
Par : Google LLC
4.3 / 5
158,2 M avis
1 commentaire
1 commentaire
  1. Super initiative.
    Travailler tranquillement, sans avoir besoin de se connecter à Internet, c’est vraiment bien.

    Bravo Google, des inventions comme cela, j’adore.
    Et en plus, la reconnaissance vocale est au point !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *