Anthropic dévoile Claude Sonnet 5, sa nouvelle IA par défaut : voici tout ce qui change

Anthropic ne se repose pas sur ses lauriers. La start-up de Dario Amodei vient de dégainer un tout nouveau modèle d’IA, Sonnet 5. Celui-ci est présenté comme « le modèle Sonnet le plus agentique jamais conçu ». Le modèle est capable d’agir de façon autonome sur plusieurs étapes, sans que l’utilisateur ait besoin de reformuler sa demande à chaque instruction.

Introducing Claude Sonnet 5, our most agentic Sonnet yet.

It makes plans, uses tools like browsers and terminals, and runs autonomously at a level that just a few months ago required larger and more expensive models. pic.twitter.com/UKK8G7ww5h

— Claude (@claudeai) June 30, 2026

La société américaine précise que les capacités agentiques de ses solutions se sont d’abord accélérées avec les précédentes versions de Sonnet (3.5, 3.6, 3.7). Par la suite, les gains les plus significatifs se sont concentrés sur la gamme Opus, plus chère et plus puissante. Avec Sonnet 5, l’entreprise affirme vouloir redistribuer les avancées agentiques vers son modèle intermédiaire, nettement moins coûteux à faire fonctionner. L’objectif premier est de démocratiser les dernières innovations d’Anthropic en matière d’agents IA. L’IA succède à Claude Sonnet 4.6, la précédente IA de référence du groupe, et qui date de février dernier.

À lire aussi : Anthropic annonce le retour de Claude Fable 5 et Mythos 5, les États-Unis ont levé l’interdiction

Un modèle d’IA proche de Claude Opus 4.8

Parmi les capacités phares de Sonnet 5, on trouve la possibilité pour l’IA de s’auto-évaluer. Concrètement, l’IA prend désormais l’initiative de relire et corriger son propre travail sans qu’on lui demande explicitement de le faire. Lorsque Sonnet 5 exécute une tâche complexe en plusieurs étapes, il repasse sur sa propre production pour détecter d’éventuelles erreurs, incohérences ou oublis. C’était une fonction qui était autrefois réservée aux modèles Opus.

Sur les benchmarks, Sonnet 5 se rapproche ou égalise avec Claude Opus 4.8, un modèle payant qui est considéré comme le modèle d’intelligence artificielle le plus puissant d’Anthropic. Comme le montre le test « Humanity’s Last Exam », censé mesurer des connaissances de très haut niveau, l’écart entre les deux modèles est jugé « négligeable », estime Anthropic. Sur les usages les plus exigeants, le modèle ne remplace pas son grand frère, plus sophistiqué et complet. Comme l’explique Anthropic dans son billet de blog, Sonnet 5 a été programmé pour offrir des performances proches d’Opus sur la plupart des tâches de la vie quotidienne.

À lire aussi : Anthropic vs Trump, la Chine, alerte d’Amazon… Les dessous de la suspension de Claude Fable 5 et Mythos 5

Hallucinations et garde-fous

Anthropic assure que Sonnet 5 affiche un taux plus faible de « comportements indésirables » que son prédécesseur. En clair, le risque d’hallucinations est moins élevé. Il y a moins de chances que l’IA se mette à vous raconter n’importe quoi avec aplomb. Le modèle serait aussi plus efficace pour refuser des requêtes malveillantes et résister aux tentatives de manipulation issues de requêtes piégées. Contrairement aux modèles Opus, Sonnet 5 n’a pas été spécifiquement entraîné sur des tâches relatives à de la cybersécurité. Selon les tests menés par Anthropic, le modèle n’est pas en mesure de trouver le moyen d’exploiter une faille de sécurité dans du code informatique. Le fabricant précise malgré tout avoir activé par défaut des garde-fous de cybersécurité, similaires à ceux déployés sur Opus 4.7 et 4.8, pour éviter d’éventuels abus.

Avec des performances proches d’Opus, Sonnet 5 devient la nouvelle IA de référence d’Anthropic. C’est le nouveau choix par défaut des utilisateurs sans abonnement et des clients ayant opté pour l’abonnement Claude Pro. Il est évidemment aussi disponible pour les abonnés Max, Team et Enterprise.

Anthropic dévoile Claude Science

Dans la foulée, Anthropic a levé le voile sur Claude Science, un nouvel espace de travail conçu pour aider les scientifiques à mener leurs recherches. Disponible en version bêta pour les abonnés Pro, Max, Team et Entreprise, cet outil vise à rassembler en un seul endroit toutes les étapes d’un projet de recherche.

Ce lancement s’accompagne d’un programme de financement destiné à soutenir jusqu’à 50 projets utilisant Claude Science, avec des crédits pouvant atteindre 30 000 dollars. Avec cette nouvelle fonctionnalité, Anthropic cherche à venir séduire les scientifiques, en miroir de son rival Google Deepmind. Le marché de l’IA appliquée à la recherche scientifique devrait passer d’environ 1,44 milliard de dollars en 2025 à près de 10,63 milliards de dollars d’ici 2035. Sans surprise, Anthropic veut sécuriser une part du gâteau.

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

Florian Bayard