Les modèles d’IA permettent déjà d’automatiser des tâches, comme la rédaction d’un brouillon, l’analyse d’une grande quantité d’information ou encore la génération de rapports détaillés. Cependant, les laboratoires d’IA vont encore plus loin en proposant des modèles capables d’utiliser les interfaces d’ordinateurs comme le ferait un humain. Grâce à ces agents, il devient possible de confier de vraies tâches, en particulier certaines tâches répétitives, à l’intelligence artificielle.
Aujourd’hui, on a déjà la possibilité d’utiliser des agents d’intelligence artificielle sur ChatGPT ou encore sur le navigateur de Perplexity. Et, cette semaine, Google officialise son nouveau modèle Gemini 2.5 Computer Use. La firme explique qu’au lieu d’interagir avec les logiciels via des API structurées, ce modèle a appris à naviguer sur les interfaces comme le ferait un humain, en cliquant, en saisissant du texte et en défilant le contenu.
Google Chrome pourra bientôt cliquer à votre place
Google a annoncé la disponibilité en préversion de Gemini 2.5 Computer Use pour les développeurs, via ses plateformes Google AI Studio ou Vertex AI. En d’autres termes, il sera possible de développer des logiciels qui tirent profit de cet agent qui peut utiliser un ordinateur à la place des personnes.
Mais, en même temps, Google développe aussi une fonctionnalité similaire, qui sera directement intégrée à son navigateur Chrome. Pour rappel, il s’agit encore du navigateur le plus utilisé dans le monde. Au mois de septembre, la firme a annoncé l’arrivée de nombreuses fonctionnalités basées sur l’intelligence artificielle générative sur Chrome, aux États-Unis. Et celui-ci a profité de cette annonce pour indiquer qu’il dotera Chrome d’un agent.
“Au cours des prochains mois, nous allons introduire des fonctionnalités d’agent dans Gemini dans Chrome. Celles-ci permettront à Gemini dans Chrome de gérer les tâches fastidieuses qui vous prennent tant de temps, comme prendre rendez-vous chez le coiffeur ou commander vos courses hebdomadaires. Vous indiquez à Gemini dans Chrome ce que vous souhaitez faire, et il agit à votre place sur les pages Web, pendant que vous vous concentrez sur d’autres choses”, avait écrit la firme.
Un concurrent de l’Agent Builder d’OpenAI
Google officialise Gemini 2.5 Computer Use alors que, de son côté, OpenAI vient de présenter un outil similaire appelé AgentKit, qui permet aux entreprises et aux développeurs d’utiliser les outils du créateur de ChatGPT pour créer des agents d’intelligence artificielle personnalisés.
Google affirme par ailleurs que son modèle Gemini 2.5 Computer Use “surpasse les principales alternatives sur plusieurs benchmarks de contrôle Web et mobile, le tout avec une latence réduite”.
Our new Gemini 2.5 Computer Use model can navigate browsers just like you do. 🌐
It builds on Gemini’s visual understanding and reasoning capabilities to power agents that can click, scroll and type for you online – setting a new standard on multiple benchmarks, with faster… pic.twitter.com/Fqmov9Kkhb
— Google DeepMind (@GoogleDeepMind) October 7, 2025
Dans l’exemple ci-dessous, l’IA fait automatiquement le tri sur une liste de clients (d’un spa pour animaux de compagnie), ajoute les noms triés sur un CRM, puis organise des rendez-vous.
Dans cet autre exemple, l’agent basé sur Gemini 2.5 Computer Use essaie de mettre de l’ordre sur un tableau de tâches, en suivant les consignes de l’utilisateur.
- On entre progressivement dans l’ère des agents IA : alors qu’OpenAI vient de présenter AgentKit, Google lève le voile sur Gemini 2.5 Computer Use
- Il s’agit d’un nouveau modèle d’IA que les développeurs pourront utiliser pour intégrer des agents, capables d’utiliser un ordinateur comme le ferait un humain, à leurs produits
- Google travaille aussi sur des fonctionnalités agentiques pour Google Chrome, qui nous permettront de confier des tâches à l’intelligence artificielle sur le navigateur
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
