Passer au contenu

Anthropic présente Claude Opus 4.7 : la nouvelle IA ultime pour écourter vos journées au bureau

Anthropic vient de dévoiler son nouveau modèle Claude Opus 4.7. Celui-ci n’est pas aussi puissant que Mythos, mais il dépasse les autres modèles disponibles sur une évaluation qui tient compte des tâches de la vie réelle.

La concurrence entre les laboratoires d’IA est rude et oblige ceux-ci à sortir de nouveaux modèles très régulièrement. Et, cette semaine, c’est Anthropic qui dégaine son nouveau modèle Claude Opus 4.7. Cette nouveauté n’est pas aussi puissante que Claude Mythos en cybersécurité, mais pour tous ceux qui utilisent l’IA pour automatiser des tâches de bureau, ou pour écrire du code informatique, il s’agit d’une nouvelle avancée majeure. Alors que les précédents modèles de Claude ont déjà une très bonne réputation auprès des entreprises, Anthropic apporte de nouvelles qualités à ses outils grâce à Opus 4.7.

Un nouvel outil de productivité

En matière de codage, Claude Opus 4.7 peut gérer, de façon autonome, des tâches qui nécessitaient une supervision humaine. Et, pour les autres tâches de bureau, la nouvelle IA profite, par exemple, d’une meilleure vision qui lui permet de “voir” les documents envoyés par l’utilisateur avec une meilleure résolution. Opus 4.7 s’améliore aussi dans le suivi des instructions, ce qui permet à l’utilisateur d’obtenir plus facilement les résultats souhaités. Anthropic affirme que cette nouvelle IA suit les instructions de manière littérale, et certains prompts qui ne servaient à rien sur les précédents modèles pourraient produire de bons résultats sur celui-ci.

Et, pour ceux qui utilisent l’IA pour générer des documents ou des visuels, Anthropic affirme que Claude Opus 4.7 est plus créatif, ce qui améliore la qualité de la production. Sinon, Claude Opus 4.7 pourrait également exceller dans le domaine de la finance, puisqu’il dépasse toutes les autres IA actuellement disponibles sur un benchmark spécifique à ce domaine. Mais, le plus important est que Claude Opus 4.7 est le nouveau leader sur GDPval-AA, devant les modèles d’OpenAI et de Google. Cette évaluation estime la capacité de l’IA à gérer des tâches quotidiennes du “monde réel”, couvrant 44 professions dans 9 secteurs d’activité. En d’autres termes, cette nouvelle IA se présente comme le meilleur outil pour automatiser les tâches répétitives.

Un test avant la sortie de Claude Mythos

Ce mois d’avril, Anthropic a aussi présenté un modèle d’IA ultra-puissant baptisé Claude Mythos. Mais, contrairement à Opus 4.7, qui est déjà disponible sur les produits de la startup, Claude Mythos est pour le moment réservé à des organisations triées sur le volet. La raison ? Mythos a déjà des compétences très avancées en recherche de failles de sécurité et pourrait, de ce fait, mener à une vague d’attaques informatiques.

Néanmoins, Anthropic a l’intention de rendre Mythos accessible au grand public, lorsqu’il pourra le faire en toute sécurité. Et, justement, le lancement de Claude Opus 4.7 permet à l’entreprise de tester les mesures qu’il pourrait appliquer à Claude Mythos pour empêcher des hackers d’utiliser cette IA pour lancer des cyberattaques. Selon les explications d’Anthropic, la version grand public de Claude Opus 4.7 inclut “des mécanismes de protection qui détectent et bloquent automatiquement les requêtes indiquant des utilisations interdites ou à haut risque en matière de cybersécurité”. “Ce que nous apprendrons du déploiement concret de ces mesures de protection nous aidera à atteindre notre objectif final : une large diffusion des modèles de classe Mythos”, ajoute celui-ci.

Des entreprises pourront cependant obtenir une version non bridée de Claude Opus 4.7, pour des usages légitimes. Mais celles-ci devront s’inscrire à un programme spécial.

Ce qu’on en pense

Anthropic a fait des entreprises (et des professionnels) sa niche. De ce fait, il est normal qu’en développant ce nouveau modèle, l’entreprise se soit focalisée sur les qualités les plus importantes pour sa cible. Et cela est validé par un benchmark indépendant qui essaie d’évaluer les gains de productivité obtenus grâce à l’IA.

Et tout porte à croire que les principaux d’Anthropic (Google et OpenAI) pourraient emprunter une voie similaire. En effet, si le fait d’avoir une IA populaire auprès du grand public est un succès, les entreprises et les professionnels qui travaillent avec un chatbot sont plus enclins à payer un abonnement.

  • Anthropic vient de présenter Claude Opus 4.7, une nouvelle IA qui inclut de nombreuses améliorations en matière de productivité
  • Claude Opus 4.7 est notamment le nouveau numéro 1 sur GDPval-AA, une évaluation des compétences des IA sur les tâches de la vie réelle
  • Claude Opus 4.7 permet aussi à Anthropic de tester les mesures qu’il pourrait prendre pour sécuriser la sortie de Claude Mythos

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech