Google a de nombreux produits basés sur l’IA, mais l’un des produits qui ont le plus fait le buzz en 2024 est NotebookLM. Pour rappel, il s’agit d’un produit de prise de note ou d’un assistant de recherche sur lequel l’utilisateur peut mettre en ligne des documents, des liens de pages web et même des vidéos YouTube, pour que l’IA de Gemini puisse synthétiser toutes ces informations, ou répondre aux questions de l’utilisateur en s’appuyant sur ces documents. Et l’une des fonctionnalités les plus intéressantes de NotebookLM est que celui-ci est même capable de produire un épisode de podcast, avec un hôte et un invité (des voix de synthèse) qui résume les documents donnés par l’utilisateur.
Le générateur de podcasts arrive sur Gemini
Aujourd’hui, cette technologie de génération de podcasts n’est plus réservée à NotebookLM, puisque Google vient d’annoncer son intégration à l’application Gemini. “Nous avons constaté un engouement incroyable pour l’aperçu audio dans NotebookLM, qui aide les gens à donner du sens à des informations complexes. Aujourd’hui, nous rendons l’aperçu audio disponible dans Gemini”, écrit Dave Citron, le responsable de l’app Gemini. Le chabot pourra donc traiter un fichier, une présentation ou même les rapports générés par sa fonctionnalité Deep Research (une nouveauté qui a récemment été rendue gratuite) et retourner une discussion audio façon podcast. “Ils résumeront le matériel, établiront des liens entre les sujets, s’engageront dans un va-et-vient dynamique et apporteront des perspectives uniques”, explique Dave Citron.
L’intérêt du podcast, par rapport au texte, est qu’il permet de s’informer sur le contenu d’un document tout en faisant autre chose. Un étudiant pourrait aussi mettre en ligne ses cours pour obtenir un podcast qui pourra aider celui-ci pour ses révisions. Malheureusement, si Google prévoit de proposer cette nouveauté Gemini partout dans le monde, la fonctionnalité ne prend encore en charge que la langue anglaise. Mais Google indique que d’autres langues seront “bientôt” prises en charge.
Canvas : une autre puissante fonctionnalité qui débarque sur Gemini
En plus de la fonctionnalité de génération de podcasts, Gemini se dote aussi d’une nouveauté baptisée Canvas. À l’instar du Canvas de ChatGPT, celui de Gemini est un espace de travail sur lequel l’utilisateur pourra collaborer avec l’intelligence artificielle. Par exemple, l’utilisateur pourra sélectionner le paragraphe d’un texte et demander à Gemini d’ajuster le ton.
We’re introducing Canvas and welcoming Audio Overview to the @GeminiApp today. Turn docs, slides + Deep Research reports into podcasts with Audio Overview. Or create a doc or coding project with Canvas – it spins up prototypes super fast and you can edit with Gemini in real-time. pic.twitter.com/tEdlZoSqeS
— Sundar Pichai (@sundarpichai) March 18, 2025
Mais cet outil sera aussi très utile pour les développeurs, puisqu’il propose un espace interactif pour visualiser les éléments. Pour tester Canvas, il suffit de cliquer sur le nouveau bouton qui s’affiche sous le champ de texte de Gemini.
- En 2024, l’outil NotebookLM de Google a fait un gros buzz, notamment grâce à une fonctionnalité qui génère des podcasts à partir des documents fournis par l’utilisateur
- Cette fonctionnalité est désormais proposée sur l’application Gemini
- Pour le moment, les podcasts générés sont en anglais, mais Google promet de prendre en charge d’autres langues
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.