- OpenAI annonce deux grosses mises à jour de ChatGPT : l’IA se dote d’une vraie interface vocale, et permet aussi d’envoyer des photos
- Grâce à cette mise à jour, l’IA peut rivaliser avec les assistants vocaux comme Amazon Alexa ou Google Assistant
- Mais ces deux nouveautés ne seront déployées, d’ici quelques semaines, que chez les utilisateurs payants
La concurrence dans le domaine de l’intelligence artificielle est de plus en plus intéressante. Alors qu’Amazon a récemment annoncé l’arrivée de l’IA générative sur son assistant Alexa, OpenAI lance, de son côté, 2 nouveautés importantes pour ChatGPT. Désormais, il est possible de communiquer avec l’IA, comme si on discutait avec un être humain, grâce à la nouvelle interface vocale. De plus, ChatGPT se dote aussi de la vue : vous pourrez envoyer une photo à l’intelligence artificielle, et poser des questions ou demander des informations par rapport à cette photo.
ChatGPT devient un vrai assistant
Quand OpenAI a lancé ChatGPT, celui-ci était un simple chatbot. Si les informations fournies sont impressionnantes, il fallait discuter avec le chatbot avec du texte. Mais cela change grâce à la mise à jour annoncée par OpenAI, puisqu’il devient possible d’utiliser la voix.
“La nouvelle capacité vocale est alimentée par un nouveau modèle de synthèse vocale, capable de générer un son de type humain à partir de seulement du texte et de quelques secondes d’échantillons de parole. Nous avons collaboré avec des comédiens professionnels pour créer chacune des voix. Nous utilisons également Whisper, notre système de reconnaissance vocale open source, pour transcrire vos paroles en texte”, lit-on dans l’annonce.
A more intuitive interface for ChatGPT. Just chat with it using your voice or show it what you’re talking about using images. Rolling out over next 2 weeks. https://t.co/nTqJEXIw5S
— Mira Murati (@miramurati) September 25, 2023
Notons qu’OpenAI présente cette nouveauté, qui rend l’expérience ChatGPT plus pratique et plus humaine, juste après une importante annonce d’Amazon. Comme nous l’évoquions dans un précédent article, il y a quelques jours, le géant du e-commerce a présenté une fonctionnalité d’Alexa, sur les enceintes connectées, qui permet d’accéder à une intelligence artificielle générative de type ChatGPT (mais avec la voix).
Sinon, Amazon a aussi annoncé un partenariat (et jusqu’à 4 milliards de dollars d’investissement) avec l’un des principaux concurrents d’OpenAI, la startup Anthropic. Grâce à ce partenariat, Amazon peut utiliser les modèles de cette startup pour améliorer ses produits et ses services. Cet accord profite aussi aux utilisateurs d’Amazon Web Services.
ChatGPT peut voir
L’interface vocale de ChatGPT permettra d’interagir avec l’IA en utilisant la voix (comme sur les assistants intégrés à nos smartphones) au lieu de lire et d’écrire. Mais en plus de cela, l’IA devient aussi capable de décrypter les photos et de répondre à des requêtes posées par rapport à ces photos.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Par exemple, l’utilisateur peut envoyer une photo de son vélo à ChatGPT, puis demander de l’aide pour abaisser la selle. Puis, l’IA peut par exemple demander une photo des outils disponibles pour se rendre plus utile. Sinon, il est également possible d’envoyer une photo de l’intérieur du frigo pour obtenir des conseils de cuisine.
Malheureusement, pour le moment, ces deux nouveautés de ChatGPT ne sont disponibles que pour les utilisateurs payants, soit via l’abonnement ChatGPT Plus, soit via l’abonnement ChatGPT Entreprise. Elles seront déployées dans les prochaines semaines. La possibilité d’envoyer des photos sera disponible sur toutes les plateformes, tandis que l’interface vocale sera disponible sur Android et iOS.
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
Une IA qui va enfin nous permettre d’être totalement stupide et de nous éviter tous les efforts d’apprentissage.
Allélu IA!