Skip to content

Anthropic a dévoilé son IA 'dangereuse'

Anthropic vient de lancer Fable 5, la version publique de son modèle Mythos, autrefois jugé 'trop dangereux' pour être publié. Ses performances aux benchmarks ne sont pas seulement une amélioration ; c'est une nouvelle classe d'IA.

Nora Vance
Hero image for: Anthropic a dévoilé son IA 'dangereuse'

En bref / Points clés

  • Anthropic vient de lancer Fable 5, la version publique de son modèle Mythos, autrefois jugé 'trop dangereux' pour être publié.
  • Ses performances aux benchmarks ne sont pas seulement une amélioration ; c'est une nouvelle classe d'IA.

Le modèle 'interdit' est rendu public

Anthropic a dévoilé Mythos, un modèle d'IA qu'il avait autrefois explicitement retenu comme "trop dangereux" pour une diffusion publique. Aujourd'hui, ce modèle de pointe émerge aux côtés de son homologue grand public, Fable 5, marquant un changement significatif et délibéré dans la stratégie de déploiement d'Anthropic. Ce double lancement introduit ce que de nombreux experts perçoivent comme une nouvelle classe d'intelligence artificielle.

Une distinction fonctionnelle claire sépare ces modèles puissants. Anthropic a conçu Mythos comme un outil puissant et non protégé, spécifiquement pour la communauté de la sécurité. Ces spécialistes exploiteront ses capacités brutes pour identifier les vulnérabilités critiques et renforcer les logiciels, fonctionnant sans les garde-fous de sécurité intégrés à Fable 5. Mythos joue ainsi un rôle crucial et spécialisé dans l'amélioration de la sécurité numérique.

Fable 5, à l'inverse, intègre des garde-fous de sécurité complets, le rendant idéal pour une utilisation générale dans un large éventail d'applications. Ce modèle occupe désormais sans équivoque la position de fleuron dans la hiérarchie des modèles d'Anthropic, dépassant de manière démontrable les capacités de ses prédécesseurs : - Haiku - Sonnet - Opus

En tant que "modèle de classe Mythos", Fable 5 a été méticuleusement affiné pour un déploiement large et sécurisé, ses capacités dépassant significativement celles de tout modèle Anthropic précédemment mis à la disposition du grand public.

Une déroute aux benchmarks

Fable 5 n'a pas seulement concouru aux benchmarks ; il a infligé une déroute aux benchmarks. Sur les tâches de codage agentique, il a établi une avance significative. SweBench Pro a vu Fable 5 atteindre un impressionnant 80%, surpassant substantiellement Opus 4.8 à 69% et GPT 5.5 à 58%.

Cette domination s'est étendue à Frontier Code (Diamond), où Fable 5 a obtenu 29,3%. C'est plus du double de la performance d'Opus 4.8 et près de cinq fois les 5,7% de GPT 5.5. Au-delà du codage, Fable 5 a également excellé dans des domaines où les modèles Anthropic précédents étaient parfois à la traîne. Il a obtenu 1932 sur GDP Val, un benchmark pour le travail de connaissance du monde réel, surpassant Opus 4.8 (1890) et GPT 5.5 (1769). Son raisonnement spatial s'est également considérablement amélioré, atteignant 38,6%.

Malgré ces impressionnantes victoires numériques, une perspective critique émerge de l'expérience utilisateur. Alors que les benchmarks fournissent souvent des métriques objectives, les "sensations" de l'utilisation réelle peuvent parfois raconter une histoire différente. De nombreux utilisateurs soutiennent que GPT 5.5 semble plus capable que ses scores ne le suggèrent, en particulier par rapport à Opus 4.8, créant une déconnexion perçue entre les chiffres bruts et l'utilité pratique.

Au-delà des chiffres : un nouveau type d'intelligence

Fable 5 offre une interaction qualitativement distincte, allant au-delà des chiffres impressionnants des benchmarks. Les utilisateurs décrivent même des requêtes mineures initiant ce qui ressemble à une exploration massive. Le modèle pourrait plonger dans une base de code entière, examinant méticuleusement chaque angle possible de chaque ligne, transformant une simple invite en une entreprise inattendument profonde et complète. Cette profondeur peut sembler presque "insultante" pour les vastes capacités du modèle lorsqu'il est confronté à des tâches apparemment triviales.

Cet engagement profond se manifeste par une caractéristique unique : la densité d'information. La sortie de Fable 5 s'avère incroyablement concise mais remarquablement complexe, transmettant significativement plus de sens par token que ses prédécesseurs. Le traitement de ses réponses exige une concentration accrue de la part de l'utilisateur, car chaque déclaration encapsule souvent des couches de raisonnement sophistiqué et d'aperçus complexes, repoussant les limites de l'interaction typique entre l'homme et l'IA.

La véritable prouesse de Fable 5 se révèle dans les tâches autonomes de longue durée. Il démontre une capacité étonnante à s'attaquer à des problèmes très complexes sans faillir, compressant sans effort un travail qui pourrait s'étendre sur des mois pour des ingénieurs humains en des laps de temps remarquablement courts. Des anecdotes, telles que Stripe qui aurait tiré parti de modèles aussi avancés pour condenser de vastes projets d'ingénierie en une seule journée, soulignent ce potentiel transformateur. Pour plus de détails sur ces modèles révolutionnaires, y compris Claude Fable 5 et Claude Mythos 5 - Anthropic, le blog officiel d'Anthropic propose des analyses complètes.

Le Prix de la Puissance

Le Fable 5 d'Anthropic arrive avec un prix élevé : 50 $ par million de tokens de sortie. Ce n'est pas une dépense anodine ; cela signale un investissement stratégique pour des tâches où ses capacités agentiques inégalées réduisent drastiquement le travail humain. Le calcul économique change lorsqu'un modèle peut résoudre des problèmes comme SweBench Pro avec une précision de 80 %, dépassant de loin l'efficacité humaine sur du code complexe.

Cette stratégie de tarification cristallise le paradigme émergent du routage de modèles. Les organisations orchestreront de plus en plus une approche échelonnée, déployant des modèles de pointe comme Fable 5 pour leurs défis les plus insolubles. Pour les opérations de routine, des modèles plus rentables tels que Sonnet géreront la majeure partie des tâches quotidiennes, optimisant l'allocation des ressources. Cette orchestration intelligente maximise à la fois la qualité de la production et la rentabilité.

Considérez les implications d'une telle densité d'information. La tendance de Fable 5 à traiter les requêtes mineures comme des explorations profondes suggère une complexité de traitement interne au-delà de notre compréhension actuelle. Spéculativement, à mesure que ces IA avancées continuent d'évoluer, elles pourraient développer leurs propres langages hyper-efficaces et denses, optimisant la communication interne et la représentation des connaissances d'une manière incompréhensible pour la cognition humaine. Cela pourrait débloquer des avancées cognitives imprévues.

Foire aux Questions

Que sont les modèles Fable 5 et Mythos d'Anthropic ?

Fable 5 est le nouveau modèle d'IA de pointe d'Anthropic disponible pour une utilisation générale. Mythos est le même modèle sous-jacent mais sans garde-fous de sécurité, publié spécifiquement pour que les chercheurs en sécurité puissent trouver et corriger les vulnérabilités.

Pourquoi le modèle Mythos a-t-il été jugé 'trop dangereux' pour être publié ?

Le modèle original de classe Mythos a été retenu en raison de préoccupations concernant son potentiel de mauvaise utilisation sans contrôles de sécurité appropriés. La version maintenant publiée est destinée à un public contrôlé d'experts en sécurité pour renforcer de manière proactive les systèmes logiciels.

Comment Fable 5 se compare-t-il à des modèles comme GPT-5.5 ?

Sur des benchmarks clés comme SweBench Pro pour le codage agentique, Fable 5 obtient des scores significativement plus élevés (80 %) que les scores rapportés pour GPT-5.5 (58 %). Il montre également une avance substantielle dans d'autres domaines comme le travail de connaissance complexe et le raisonnement.

Qu'est-ce qui est unique dans l'utilisation de Fable 5 ?

Les utilisateurs rapportent que Fable 5 donne l'impression d'appartenir à une classe d'IA différente. Il aborde les tâches avec une profondeur immense, traitant les requêtes simples comme des explorations majeures, et produit une sortie très 'dense en informations' qui transmet des idées complexes avec moins de mots.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀En savoir plus

Gardez une longueur d'avance en IA

Découvrez les meilleurs outils IA, agents et serveurs MCP sélectionnés par Stork.AI.

P.S. Vous avez créé quelque chose d'utile ? Listez-le sur Stork