Fable 5 a été jailbreaké en un jour. Ce que ça veut vraiment dire.

Prenez de l'avance

Recevez des analyses, des idées et des actualités directement dans votre boîte de réception.

Sur cette page

Partager

Facebook
X (Twitter)
LinkedIn

Ce qui a levé les restrictions de sécurité de Fable 5, le plus récent modèle d’IA d’Anthropic, c’est potentiellement une seule personne, agissant contre un système soutenu par des milliards de dollars, des milliers d’ingénieurs et une promesse de contrôles de sécurité sans précédent. En cybersécurité, on a un dicton : rien ne reste protégé éternellement, même si peu s’attendaient à ce que ça signifie quelques heures après le lancement.

Un modèle bâti sur un paradoxe

Pour comprendre ce qui s’est passé avec Fable 5, il faut comprendre la stratégie qui le sous-tend. Anthropic a lancé deux modèles simultanément : Fable 5 et Mythos 5, deux produits très différents issus de la même source.

Fable 5 est le modèle grand public, enveloppé dans une architecture de sécurité élaborée ciblant trois domaines précis : la cybersécurité, la biologie et la chimie. L’objectif était de prévenir les abus en empêchant les acteurs malveillants d’utiliser l’IA pour découvrir des failles, concevoir des agents biologiques dangereux ou synthétiser des substances illicites.

Mythos 5, en revanche, est la version non contrainte, réservée exclusivement aux partenaires de grandes corporations ayant participé au projet Glasswing, le cercle fermé de collaborateurs sélectionnés d’Anthropic. Tout le monde d’autre travaille dans les limites de Fable 5. En tentant de verrouiller la porte d’entrée contre les mauvais acteurs, Anthropic a involontairement fermé la porte à beaucoup de professionnels qui en avaient le plus besoin.

Les experts ne sont pas impressionnés

La communauté de la cybersécurité, ainsi que les professionnels de la médecine et de la chimie, ont exprimé leur frustration sans détour. Les restrictions de sécurité de Fable 5 sont, pour le dire franchement, des instruments grossiers : pas des garde-fous soigneusement calibrés, mais des restrictions suffisamment larges pour signaler le mot « cancer » lorsqu’un chercheur médical essaie simplement de faire son travail.

Les professionnels de ces domaines se retrouvent incapables d’utiliser Fable 5 pour des tâches légitimes et courantes. Les analystes en cybersécurité qui doivent étudier des vulnérabilités, les biologistes travaillant sur la modélisation des maladies, les chimistes développant des composés pharmaceutiques : tous se heurtent à un modèle ostensiblement conçu pour protéger la société.

S’ajoute à la frustration ce que certains experts décrivent comme un repli silencieux : des rapports indiquent que Fable 5 se rétrograde parfois discrètement lui-même, transférant une requête à un modèle plus ancien et moins performant sans aucune notification à l’utilisateur. Quelqu’un qui paie pour des performances de pointe se retrouve à recevoir quelque chose de nettement inférieur, sans aucune indication que quoi que ce soit ait changé. Pour les organisations qui s’appuient sur ces capacités pour des travaux critiques, ce genre d’opacité n’est pas un inconvénient mineur ; il érode fondamentalement la confiance dans la plateforme.

Le jailbreak : « Pack Hunt »

Dans les jours suivant le lancement de Fable 5, quelqu’un, travaillant d’ailleurs peut-être seul, a réussi à contourner ses restrictions de sécurité grâce à une méthode appelée « pack hunt ». Plutôt qu’une simple injection de prompt, il s’agissait d’une attaque sophistiquée et coordonnée : une armée d’agents IA envoyant des instructions simultanées, conçue pour submerger et dérouter les mécanismes de sécurité du modèle jusqu’à ce qu’il perde ses limites.

Plus significatif encore, l’attaquant a également extrait le prompt système caché de Fable 5; le jeu d’instructions internes régissant le comportement du modèle, dont la longueur serait d’environ 120 000 lignes. Quand on connaît la forme exacte d’une clôture, trouver la porte devient considérablement plus facile.

Cette réalité n’est pas propre à Fable 5, mais une vérité fondamentale en cybersécurité : tout système a une limite et la question n’est jamais de savoir s’il peut être brisé, mais quand et à quel coût.

La vitesse de la menace a changé

Ce qui distingue l’incident Fable 5, ce n’est pas la brèche en elle-même, mais la rapidité avec laquelle elle s’est produite. Anthropic a déployé toutes les ressources à sa disposition pour durcir le modèle avant le lancement, notamment des red teamers, des chercheurs indépendants et des tests de stress internes et il a quand même été jailbreaké en un jour de publication, par ce qui n’était peut-être qu’un seul individu.

L’asymétrie entre attaquants et défenseurs n’a jamais été aussi prononcée : une organisation bien dotée en ressources peut passer des mois à fortifier un système, tandis qu’un individu motivé le démantibule en une après-midi. Lorsqu’on est une cible de premier plan, ce qu’Anthropic est indubitablement, cette exposition attire exactement le type de talent qu’on s’efforce d’éloigner.

Quand les gouvernements coupent le courant

Puis, le 12 juin, trois jours après le lancement de Fable 5, l’histoire a pris un tout autre tournant. Le gouvernement américain a émis une directive de contrôle des exportations en vertu de ses pouvoirs de sécurité nationale, exigeant la suspension de l’accès à Fable 5 et à Mythos 5 pour tout ressortissant étranger, qu’il soit à l’intérieur ou à l’extérieur des États-Unis, y compris les employés étrangers d’Anthropic lui-même. Plutôt que d’entreprendre le travail complexe de mise en œuvre d’un étiquetage, d’un suivi et d’un audit de nationalité pour chaque utilisateur et chaque agent sur leur plateforme, Anthropic a suspendu l’accès aux deux modèles dans leur intégralité. Les organisations qui avaient intégré ces modèles à leurs flux de travail les ont trouvés indisponibles du jour au lendemain.

Communiqué sur la directive du gouvernement américain de suspendre l’accès à Fable 5 et Mythos 5 | Anthropic : Statement on the US government directive to suspend access to Fable 5 and Mythos 5 \ Anthropic

Gartner, dans une note de recherche publiée le 15 juin, a présenté cela comme un changement fondamental dans la signification de la souveraineté IA. Jusqu’alors, cette conversation portait sur la résidence des données, les régions cloud et le contrôle des infrastructures. La suspension de Fable 5 ajoute une nouvelle couche : l’éligibilité. Un modèle peut être hébergé dans une région approuvée, traiter des données approuvées et fonctionner sur une infrastructure conforme et être néanmoins indisponible pour certains utilisateurs en raison de qui ils sont, d’où ils viennent, ou du rôle qu’ils occupent. Comme l’a formulé Gartner, on ne peut plus supposer que les talents internationaux aient un accès uniforme aux mêmes outils de pointe.

Ce que cela signifie pour les organisations

L’histoire de Fable 5 n’est pas un récit préventif sur un seul modèle ou une seule entreprise, mais un signal sur l’état actuel du paysage de la sécurité de l’IA et sur la direction qu’il prend.

La formulation de Gartner pour ce moment est utile : l’accès aux modèles frontier est désormais une dépendance réglementée et non une commodité1. L’hypothèse d’antan, qu’un modèle disponible via une API pouvait simplement être mis en production et être fiable ne tient plus. Les organisations qui s’appuient sur des modèles frontier doivent désormais traiter l’accès comme pouvant devenir conditionnel, restreint ou indisponible avec peu de préavis et concevoir leurs systèmes en conséquence.

Les organisations qui naviguent avec succès dans cette ère ne sont pas celles qui attendent que les fournisseurs d’IA offrent des garanties de sécurité parfaites, mais celles qui construisent des défenses adaptées au rythme et à la complexité actuels des menaces, des défenses qui ne considèrent aucune couche comme suffisante et regardent le modèle d’aujourd’hui comme la vulnérabilité potentielle de demain.

En cybersécurité, la promesse n’a jamais été l’invulnérabilité, mais la vigilance, l’adaptation et l’expertise pour répondre lorsque la clôture est coupée, ce qui arrivera inévitablement. La question est de savoir si vous le saurez quand cela arrivera et si vous serez prêt.

Notes

1 Gaurav Gupta, Chirag Dekate, Daniel Bowers, Ganesh Ramamoorthy, Fernando Pereiro et Andrew Lerner, « First Take: Frontier AI Access Now a Vendor Risk Surface With Mythos 5 and Fable 5 Suspension », Gartner, 15 juin 2026, ID G00858726

Publications connexes

Merci pour
votre demande!

Nous vous contacterons bientôt pour mieux comprendre vos besoins et personnaliser la démonstration.

Au plaisir d’échanger avec vous.

— L’équipe WeActis