En bref / Points clés
- Anthropic vient de lancer Claude Fable 5, un nouveau modèle qui domine les benchmarks de codage et laisse des concurrents comme GPT-5.5 loin derrière.
- Mais sa puissance incroyable s'accompagne de mesures de sécurité agressives et d'une stratégie de prix bizarre qui pourrait vous faire hésiter.
Le nouveau roi des benchmarks est arrivé
Claude Fable 5 5 d'Anthropic, son premier modèle de classe Mythos (désigne une classe de modèles d'IA d'Anthropic, spécifiquement Claude Mythos 5) généralement disponible, a radicalement redéfini les benchmarks de codage IA, s'imposant comme l'état de l'art dans presque toutes les évaluations. Le modèle a réalisé un saut remarquable de 10 % en performance de codage agentique sur SWE-BenchPro, surpassant significativement ses concurrents. Il est également en tête de la nouvelle évaluation FrontierCode de Cognition, qui évalue spécifiquement si le code généré est réellement 'fusionnable' par un mainteneur humain.
Ses prouesses s'étendent au-delà des tests académiques à des applications massives du monde réel. Stripe a utilisé Claude Fable 5 5 pour exécuter une migration à l'échelle de la base de code de son système Ruby de 50 millions de lignes, achevant cette tâche monumentale en une seule journée. Cet exploit souligne la capacité inégalée du modèle à gérer des tâches agentiques complexes et de longue durée, en maintenant sa concentration sur des millions de tokens et en améliorant les résultats avec ses propres notes.
Claude Fable 5 5 creuse un écart de capacité marqué face à des rivaux comme GPT 5.5, particulièrement dans la génération d'interfaces utilisateur complexes. Des démonstrations ont révélé que Fable 5 pouvait recréer un site web haute fidélité à partir d'une seule capture d'écran avec une précision impressionnante, une tâche où GPT 5.5 était significativement en retard, produisant des résultats décrits comme "loin derrière" en matière de conception d'interface utilisateur. Cette différence souligne la compréhension et l'exécution supérieures de Fable 5 des exigences visuelles et de codage complexes.
Plus qu'un simple codeur
Au-delà du code, Claude Fable 5 5 fait preuve d'une intelligence visuelle remarquable. Il peut "one-shot" un site web haute fidélité, recréant le site Linear, générant tout le code et les actifs nécessaires à partir d'une seule capture d'écran, sans accès web. Cette capacité suggère une compréhension profonde de la mise en page visuelle et de la conception fonctionnelle, traduisant des images statiques en expériences dynamiques et interactives avec une fidélité impressionnante.
De manière cruciale, Claude Fable 5 5 redéfinit la mémoire à long contexte et les capacités agentiques. Il maintient sa concentration sur des millions de tokens et peut exécuter des tâches complexes de plusieurs jours, comme en témoigne le test de Stripe où il a effectué une migration à l'échelle de la base de code d'une codebase Ruby de 50 millions de lignes en une seule journée. Ce raisonnement persistant et cette auto-amélioration, en tirant parti de ses propres notes, marquent un bond significatif dans le travail autonome soutenu, gérant des fenêtres de contexte allant jusqu'à 1 million de tokens par défaut.
Sa polyvalence s'étend aux défis créatifs et d'ingénierie sophistiqués. Anthropic a présenté Claude Fable 5 5 concevant un modèle CAD imprimable en 3D, le tout au sein d'un éditeur CAD basé sur navigateur que le modèle lui-même a créé de toutes pièces. Cette capacité non seulement à résoudre un problème, mais aussi à construire ses propres outils spécialisés pour la solution, souligne un niveau profond d'intégration cognitive et de maîtrise multi-domaines.
La puissance a un prix : les mesures de sécurité
Claude Fable 5 5 d'Anthropic, tout en démontrant des capacités de pointe, intègre également une approche agressive de la sécurité. Ses mesures de sécurité rigoureuses l'amènent à refuser toutes les requêtes sur les benchmarks d'évaluation de cybersécurité, échouant ainsi à zéro de ces tests. Cette posture robuste, destinée à prévenir les abus, pourrait entraîner un taux notable de faux positifs pour les utilisateurs généraux, frustrant potentiellement les flux de travail courants.
Cette publication publique prudente met en lumière la stratégie à double modèle d'Anthropic. Claude Fable 5 5 sert de modèle "de classe Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5)" généralement disponible, fortement protégé pour un accès généralisé. Pour les partenaires spécialisés, cependant, Anthropic propose le Claude Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5) (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5) 5, un modèle puissant à diffusion limitée ; Claude Fable 5 5 est le modèle 'de classe Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5)' généralement disponible) 5 moins restreint, qui lève les protections cybernétiques pour les partenaires Glasswing et d'autres restrictions spécifiques pour les chercheurs en biologie. Plus de détails sont disponibles sur Claude Fable 5 5 et Claude Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5) (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5) 5, un modèle puissant à diffusion limitée ; Claude Fable 5 5 est le modèle 'de classe Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5)' généralement disponible) 5 - Anthropic-5).
Un mécanisme de repli intégré tente d'atténuer ces refus fréquents. Les invites jugées limites sont automatiquement acheminées vers Opus 4.8 pour réévaluation. Cependant, l'efficacité de ce système reste discutable, étant donné qu'Opus 4.8 lui-même présente un taux de refus significatif, ne réussissant que 88 % de ces mêmes tests d'évaluation cybernétique. Cela suggère que les utilisateurs pourraient encore fréquemment rencontrer des rejets, même après la tentative de repli initiale.
Le Bizarre Gambit Tarifaire d'Anthropic
Anthropic a introduit un déploiement déroutant pour Claude Fable 5 5, le rendant initialement disponible via les plans d'abonnement Pro, Max, Team et Enterprise. Pourtant, cet accès est éphémère ; le modèle sera retiré de ces plans le 23 juin, passant à un système basé uniquement sur les crédits. Anthropic promet vaguement son retour aux abonnements à une date future indéterminée, une stratégie qui semble conçue pour créer une rareté artificielle et stimuler les achats immédiats de crédits.
Les développeurs font face à une structure de coûts claire : 10 $ par million de tokens d'entrée et 50 $ par million de tokens de sortie. Bien que ce tarif soit moins de la moitié de celui du précédent Claude Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5) (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5) 5, un modèle puissant à diffusion limitée ; Claude Fable 5 5 est le modèle 'de classe Mythos (fait référence à une classe de modèles d'IA Anthropic, spécifiquement Claude Mythos 5)' généralement disponible) Preview, Fable 5 épuise également les limites d'utilisation deux fois plus vite que son prédécesseur, Opus, le rendant significativement plus cher pour des charges de travail comparables. Cela suggère un coût de calcul plus élevé ou une prime accordée à ses capacités avancées.
Ajoutant une autre couche de surveillance, Anthropic a mis en œuvre une politique de rétention des données de 30 jours obligatoire pour tout le trafic API de Fable 5. Cette mesure, ostensiblement destinée à la surveillance de la sécurité, soulève d'importantes préoccupations en matière de confidentialité pour les utilisateurs et les entreprises interagissant avec le modèle. Elle exige un examen attentif des compromis entre une sécurité renforcée et la souveraineté des données lors de l'intégration de cette nouvelle IA puissante.
Foire aux questions
Qu'est-ce que Claude Fable 5 ?
Claude Fable 5 est un nouveau modèle d'AI de classe 'Mythos-class' d'Anthropic, lancé au public avec de solides garde-fous intégrés. Il établit une nouvelle norme de pointe, en particulier pour le codage complexe, la vision et les tâches agentiques de longue durée.
En quoi Fable 5 est-il différent de Claude Mythos 5 ?
Fable 5 est la version généralement disponible avec des garde-fous étendus. Mythos 5 est une version plus puissante avec moins de garde-fous, actuellement réservée aux partenaires de confiance comme les entreprises de cybersécurité pour des tâches spécialisées et à enjeux élevés.
Qu'est-ce qui rend Fable 5 si performant en codage ?
Fable 5 affiche des gains massifs sur des benchmarks comme SWE-Bench Pro et Frontier Code, qui testent la capacité d'une AI à gérer des tâches d'ingénierie logicielle complexes et réelles et à produire du code de qualité production, 'fusionnable', et pas seulement à réussir de simples tests.
Quel est le prix de Claude Fable 5 ?
Le prix de l'API est de 10 $ par million de tokens d'entrée et de 50 $ par million de tokens de sortie. Sa disponibilité sur les plans d'abonnement est temporaire, avec un projet de passer à un système de crédits d'utilisation dans un avenir proche.
