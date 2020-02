Lors de sa dernière conférence I/O en 2019, durant laquelle Google a dévoilé les nouveautés pour Android 10, celui-ci a accordé une attention particulière à l’accessibilité.

Grâce à ses progrès dans l’IA et dans la reconnaissance vocale, la firme de Mountain View est aujourd’hui en mesure de traiter les requêtes adressées à Google Assistant localement. Ce progrès de l’intelligence artificielle permet également à Google de proposer de nouvelles fonctionnalités, comme Live Caption.

Il s’agit d’une fonctionnalité, accessible sur certains appareils premium, qui génère automatiquement des sous-titres pour les vidéos qui sont diffusées à l’écran. Présenté comme une fonctionnalité d’accessibilité pour les personnes sourdes ou malentendantes, Live Caption peut aussi être utile dans certains scénarios, par exemple lorsqu’on souhaite lire une vidéo sans activer le son lors d’une réunion.

En tout cas, il semblerait qu’après avoir présenté Live Caption pour les smartphones Android, Google pourrait également lancer cette fonctionnalité sur son navigateur Chrome.

Pour le moment, rien n’a été annoncé. Mais le site Chrome Unboxed (un média qui s’est spécialisé dans les actualités sur Chrome) affirme avoir identifié des éléments sur le code de Google Chrome qui suggèrent que la firme de Mountain View travaille actuellement sur un support de Live Caption sur le navigateur.

Mais bien évidemment, pour le moment, ces informations sont encore à prendre avec les pincettes d’usage. De plus, cette fonctionnalité pour Chrome serait encore à une phase initiale de son développement. De ce fait, il faudrait probablement encore attendre un bon moment avant que celle-ci ne soit finalisée.

Des transcriptions qui se font sans le cloud ?

Généralement, les systèmes de reconnaissance vocale utilisent des modèles stockés dans les serveurs de l’entreprise qui propose la fonctionnalité. Mais Google est parvenu à réduire de manière significative la taille de son modèle de reconnaissance vocale pour que celui-ci puisse être stocké sur le smartphone de l’utilisateur et pour que la transcription puisse se faire hors-ligne.

Les avantages sont nombreux. La transcription se fait plus rapidement, ne requiert pas de connexion à internet, et pour la vie privée, le fait que les données ne sont pas transmises aux serveurs de Google est un plus.

En revanche, Live Caption n’est actuellement disponible qu’en anglais.

Pour rappel, la prochaine conférence Google I/O aura lieu au mois de mai. Et il est toujours possible que Google en dise plus sur cette possible intégration de Live Caption sur Chrome lors de cet événement.