Passer au contenu

Anthropic dévoile Claude Fable 5, une version de Mythos qui s’auto-censure pour éviter de faire des dégâts

Quelques semaines à peine après avoir présenté Claude Mythos, Anthropic est de retour avec Claude Fable 5. Il s’agit d’une IA reposant sur le même modèle, mais encadrée par des garde-fous automatiques censés empêcher tous les abus, notamment en matière de cybersécurité.

Quelques semaines seulement après avoir levé le voile sur Claude Mythos, et estimé que son IA était trop dangereuse pour être mise à disposition du grand public, Anthropic est de retour avec une version bridée intitulée Fable 5. Cette nouvelle version repose sur le même modèle d’IA, mais est encadrée par des protections renforcées. Ce sont les garde-fous qui permettent de distinguer les deux IA. Anthropic décrit Fable 5 comme « un modèle de catégorie Mythos, conçu pour un usage grand public en toute sécurité ».

A lire aussi : 10 000 failles en un mois – Anthropic dévoile le premier bilan de Claude Mythos

Une IA qui s’auto-censure

Au cœur de Fable 5, on trouve des classifieurs, des systèmes d’IA distincts qui analysent chaque requête en temps réel et détectent les demandes potentiellement dangereuses. Lorsqu’une question touche à de la cybersécurité offensive, à de la biologie, à de la chimie, la réponse est automatiquement redirigée vers Claude Opus 4.8, le modèle précédent.

« Sans mesures de protection, les capacités de Fable 5 dans des domaines comme la cybersécurité pourraient être détournées et causer des dommages importants », justifie Anthropic.

Ce mécanisme d’auto-censure doit permettre d’éviter les abus. L’utilisateur est averti du changement de modèle, et il recevra une réponse à sa question. La protection vise aussi à bloquer toutes les tentatives de copier les capacités du modèle pour entraîner une IA concurrente sans garde-fous.

Anthropic précise que ce mécanisme de censure s’active en moyenne dans moins de 5% des conversations. Dans l’écrasante majorité des échanges, l’utilisateur profite pleinement des capacités de Fable 5, et ne se retrouve pas relégué sur Claude Opus 4.8. Par prudence, Anthropic a longuement mis à l’épreuve son système de classifieurs. Aucune faille n’a été débusquée, que ce soit par ses propres chercheurs ou des organisations externes. C’est pourquoi la start-up, qui prépare activement son introduction en Bourse, a fait le choix de lancer Fable 5.

Des performances encore jamais vues

Aux dires d’Anthropic, les performances de Fable 5 dépassent celles de tous ses précédents modèles d’IA, et les benchmarks le prouvent. Le modèle excelle notamment sur les tâches longues et autonomes, qui nécessitent de maintenir le fil d’un projet pendant une longue période et de nombreux échanges. Dans les expérimentations réalisées, Fable 5 s’est montré capable de corriger ses propres erreurs et de prendre des décisions sans intervention humaine en continu. C’est justement là que réside la vraie rupture par rapport aux générations précédentes de Claude. Le nouveau fleuron d’Anthropic peut mener des projets à bien qui s’étalent sur plusieurs jours, alors que ses prédécesseurs décrochaient progressivement après quelques heures.

Gratuit jusqu’au 22 juin 2026

Fable 5 est accessible dès aujourd’hui via l’API Claude, les plateformes Amazon Web Services, Google Cloud et Microsoft Foundry. Pour les abonnés aux formules payantes (Pro, Max, Team, Enterprise), le modèle est inclus gratuitement jusqu’au 22 juin 2026. Après cette date, il faudra acheter des crédits supplémentaires pour pouvoir converser avec Fable 5. Notez que l’IA coûte plus du double du prix d’Opus 4.8.

Et voici Claude Mythos 5

En parallèle de Fable 5, Anthropic a aussi lancé Claude Mythos 5, une nouvelle version avec des garde-fous levés. Cette version reste strictement réservée aux partenaires du Projet Glasswing, qui comprend des entreprises triées sur le volet, comme Amazon Web Services, Apple, Google, Microsoft, NVIDIA, CrowdStrike, JPMorganChase ou encore Palo Alto Networks. Seules ces entités ont le droit de déployer l’IA sur leurs systèmes pour y traquer d’éventuelles failles de sécurité.

Anthropic s’engage à proposer dans un avenir proche un programme d’accès élargi, qui permettra à des organisations spécialisées dans la biologie et les sciences de tester Mythos 5. À terme, Anthropic prévoit aussi d’ouvrir un accès supervisé à Mythos 5 pour la recherche biomédicale, avec une série de garde-fous.

Anthropic accélère, mais demande de ralentir

Cette nouvelle salve de modèles d’IA de haut vol a été dévoilée quelques jours seulement après l’annonce de Claude Opus 4.8, et la mise en garde inattendue d’Anthropic. La start-up, qui fait partie des principales entités qui développent l’IA générative, estime qu’il serait bon de ralentir ou de suspendre temporairement le développement de l’IA de pointe, le temps que la recherche en sécurité puisse rattraper son retard.

À lire aussi : Le pied sur l’accélérateur, Anthropic appelle le monde à ralentir le développement de l’IA

La sortie de la première version de Mythos s’est en effet accompagnée d’une explosion de la découverte de vulnérabilités, et les chercheurs peinent à déployer des correctifs pour toutes ces failles. En parallèle, Anthropic s’est même joint au Vatican pour appeler à désarmer l’IA. Plutôt que de lever le pied comme il le préconise, Anthropic dégaine aujourd’hui deux nouveaux fleurons. Cette approche un peu schizophrène a été tournée en dérision par Sam Altman, le PDG et fondateur d’OpenAI, le grand rival d’Anthropic. Celui-ci a comparé son concurrent à un vendeur qui « construit une bombe, s’apprête à vous la lâcher sur la tête, puis vous vend un abri anti-bombe à 100 millions de dollars ». 

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.


Florian Bayard