Sakana Fugu Ultra : L'Orchestrateur d'IA qui surpasse Claude Fable 5

En bref / Points clés

Une nouvelle IA de Tokyo surpasse des géants comme Claude Fable 5, et ce n'est pas juste un autre modèle massif.
Fugu Ultra de Sakana AI utilise un système d'« orchestration » révolutionnaire qui pourrait changer la façon dont nous construisons les systèmes intelligents.

La frontière n'est pas un seul modèle

Le paradigme dominant de la construction de modèles d'IA monolithiques toujours plus grands cède la place à une stratégie plus sophistiquée. La nouvelle frontière implique la conception de systèmes intelligents qui coordonnent stratégiquement plusieurs IA spécialisées, promettant une adaptabilité et une résilience accrues face à des défis tels que les contrôles d'exportation géopolitiques. Ce changement architectural marque un départ des modèles singuliers et englobants.

Au cœur de cette évolution se trouve Sakana AI AI Fugu, un système d'orchestration multi-agents. Fonctionnant comme un LLM chef d'orchestre, Fugu est entraîné à acheminer dynamiquement les tâches entrantes vers l'agent optimal à partir d'un pool interchangeable d'autres LLM, y compris des instances récursives de lui-même. Cet orchestrateur appris, alimenté par un modèle RL Conductor de 7 milliards de paramètres, gère de manière autonome la sélection, la délégation, la vérification et la synthèse des modèles, présentant une intelligence unifiée à partir d'un seul point d'accès API.

Sakana AI AI propose Fugu en deux niveaux distincts, accessibles via une seule API compatible OpenAI. Le modèle de base Fugu équilibre des performances solides avec une faible latence, servant d'excellent choix par défaut pour les applications quotidiennes comme le codage avec Codex ou les chatbots interactifs. Pour les problèmes exigeants et multi-étapes nécessitant une précision et une profondeur maximales, Fugu Ultra intervient. Optimisé pour une qualité de réponse maximale, il coordonne un pool plus profond d'agents experts, offrant une fenêtre de contexte de 1,0 million de tokens et une sortie maximale de 131 000 tokens. Les premiers utilisateurs l'appliquent pour la recherche en IA, la production d'articles et l'analyse de cybersécurité.

Gagner sans jouer au même jeu

Les courants géopolitiques remodèlent désormais la frontière de l'IA, mis en évidence par les contrôles d'exportation américains qui ont révoqué l'accès public à Claude Fable 5 et Mythos Preview d'Anthropic le 12 juin 2026. Cette décision a suscité une demande urgente de souveraineté de l'IA, obligeant les nations et les entreprises à garantir un accès résilient et sans entrave aux modèles avancés.

Le système Fugu de Sakana AI AI, lancé le 22 juin 2026, répond directement à cet impératif. Fugu n'est pas un modèle monolithique plus grand ; au lieu de cela, son cœur est un modèle RL Conductor de 7 milliards de paramètres, un orchestrateur appris. Ce système coordonne dynamiquement un pool d'agents composé de divers LLM, même des instances récursives de lui-même, tous accessibles via une seule API compatible OpenAI.

Cette architecture multi-agents offre une protection cruciale contre le verrouillage par un fournisseur unique et les perturbations géopolitiques. Si un modèle est bloqué ou devient indisponible, Fugu peut simplement le contourner, en utilisant d'autres agents de son pool. Cette adaptabilité favorise une infrastructure d'IA plus résiliente et polyvalente, garantissant un accès continu aux capacités de pointe et permettant aux entreprises et aux nations de maintenir leur indépendance technologique. Fugu Ultra, sa variante phare, atteint une qualité de réponse maximale sur les problèmes complexes et multi-étapes, renforçant ainsi la valeur stratégique de Fugu.

Dominer les classements

Fugu Ultra a immédiatement fait sa marque, surpassant de manière décisive Claude Fable 5 sur LiveCodeBench, un benchmark dynamique pour les LLM axés sur le code. Le système d'orchestration de Sakana AI AI a obtenu un score de 93,2, dépassant les 89,8 de Fable 5 sur des problèmes de programmation compétitive frais et contrôlés contre la contamination. Cela a démontré la puissante maîtrise de Fugu Ultra sur les défis de codage complexes.

Cependant, Fugu Ultra n'a pas revendiqué une dominance universelle. Sur SWE-Bench Pro, un benchmark conçu pour les tâches d'ingénierie logicielle à long terme, Fable 5 a maintenu son avance. Cette distinction clarifie l'orientation de conception de Fugu Ultra : il excelle dans les tâches complexes individuelles, tandis que Fable 5 est spécialement conçu pour le développement logiciel soutenu et multi-étapes.

Sur un spectre plus large, Fugu Ultra a constamment démontré ses capacités supérieures. Il a surpassé d'autres modèles de pointe tels que Opus 4.8, Gemini 3.1 Pro et GPT 5.5 à travers un large éventail d'évaluations. Celles-ci incluaient des benchmarks pour le codage, le raisonnement et même les sciences humaines, soulignant la polyvalence de son orchestration multi-agents. Pour une exploration plus approfondie de son architecture, voir Sakana AI Fugu: One Model to Command Them All.

De la théorie à la réalité : Fugu en action

Les capacités de Fugu Ultra s'étendent bien au-delà des benchmarks, démontrant une utilité impressionnante dans le monde réel. Le système a mené une recherche autonome en apprentissage automatique, améliorant itérativement la recette d'entraînement d'un petit modèle GPT. En plus de 14 heures sur un seul GPU H100, Fugu a exécuté plus de 100 expériences, découvrant de manière autonome des améliorations dans la taille de lot, la profondeur du modèle, le taux d'apprentissage et les paramètres de l'optimiseur. Cet agent a également réalisé un rendement de 20% notable lors d'un test de prédiction de séries temporelles financières.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

Faisant preuve d'un raisonnement et d'une mémoire supérieurs, Fugu Ultra a excellé dans les tâches cognitives complexes. Lors d'un défi d'échecs à l'aveugle, il a surpassé un moteur ELO de 2100, démontrant sa profondeur stratégique. De plus, le système a réussi à écrire un solveur de Rubik's Cube fonctionnel à partir de zéro, un exploit où les modèles concurrents de pointe n'ont cessé de produire des solutions non viables.

Au-delà de la résolution de problèmes abstraits, Fugu Ultra a démontré une remarquable maîtrise du raisonnement spatial et structurel. Il a généré un iris mécanique entièrement fonctionnel en CAD, une conception d'ingénierie complexe. Cela contrastait fortement avec les modèles concurrents, qui n'ont produit que des conceptions imparfaites ou non fonctionnelles pour la même tâche, soulignant la capacité unique de Fugu Ultra en matière de conception générative pratique.

Foire aux questions

Qu'est-ce que Sakana Fugu Ultra ?

Sakana Fugu Ultra n'est pas un modèle d'IA unique et monolithique. C'est un système d'orchestration multi-agents qui agit comme un 'chef d'orchestre', déléguant intelligemment les sous-tâches à un ensemble de modèles d'IA spécialisés pour résoudre des problèmes complexes.

Comment Fugu Ultra surpasse-t-il des modèles comme Claude Fable 5 ?

La force de Fugu Ultra réside dans sa capacité à sélectionner le meilleur agent d'IA pour chaque partie d'une tâche. En combinant les forces de divers modèles et en évitant leurs faiblesses, il atteint des performances supérieures sur des benchmarks spécifiques et complexes comme LiveCodeBench.

Quel est l'avantage stratégique de l'architecture de Fugu ?

Son architecture favorise la 'souveraineté de l'IA' en réduisant la dépendance à un seul fournisseur de modèles. Si un modèle devient indisponible en raison de contrôles à l'exportation ou d'autres problèmes, Fugu peut simplement acheminer les tâches vers d'autres agents de son pool, assurant ainsi la résilience.

Fugu Ultra est-il meilleur que Claude Fable 5 en tout ?

Non. Bien que Fugu Ultra excelle sur de nombreux benchmarks pour les tâches complexes et multi-étapes, Claude Fable 5 a été spécifiquement conçu pour les tâches agentiques de très longue durée et surpasse toujours Fugu sur des benchmarks comme SWE-Bench Pro qui testent cette capacité.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

Cet AI Conductor vient de battre Claude Fable 5

La frontière n'est pas un seul modèle

Gagner sans jouer au même jeu

Dominer les classements

De la théorie à la réalité : Fugu en action

Foire aux questions

Qu'est-ce que Sakana Fugu Ultra ?

Comment Fugu Ultra surpasse-t-il des modèles comme Claude Fable 5 ?

Quel est l'avantage stratégique de l'architecture de Fugu ?

Fugu Ultra est-il meilleur que Claude Fable 5 en tout ?

À lire ensuite

La Révolution Post-Travail a Commencé

Le tueur d'Opus coûte 8 fois moins cher

Apple a créé un tueur de Docker

Gardez une longueur d'avance en IA