要約 / ポイント
東京発の新しいAIが、Claude Fable 5のような巨大モデルを凌駕しています。これは単なる別の巨大モデルではありません。Sakana AIのFugu Ultraは、インテリジェントシステムの構築方法を変える可能性を秘めた革新的な「orchestration」システムを採用しています。
フロンティアは単一のモデルではない
絶えず大規模化するモノリシックなAIモデルを構築するという支配的なパラダイムは、より洗練された戦略に道を譲りつつあります。新しいフロンティアは、複数の専門AIを戦略的に連携させるインテリジェントシステムを設計することを含み、地政学的な輸出規制のような課題に対する適応性と回復力の向上を約束します。このアーキテクチャの転換は、単一の包括的なモデルからの脱却を意味します。
この進化の中心にあるのは、マルチエージェントorchestrationシステムであるSakana AI AI Fuguです。conductor LLMとして機能するFuguは、他のLLMの交換可能なプール(自身の再帰的なインスタンスを含む)から最適なエージェントに受信タスクを動的にルーティングするように訓練されています。7BパラメータのRL Conductor modelを搭載したこの学習済みorchestratorは、モデルの選択、委任、検証、合成を自律的に処理し、単一のAPI endpointから統合されたインテリジェンスを提供します。
Sakana AI AIは、単一のOpenAI-compatible APIを介してアクセス可能な2つの異なる階層でFuguを提供します。ベースのFuguモデルは、強力なパフォーマンスと低レイテンシのバランスを取り、Codexでのコーディングやインタラクティブなチャットボットのような日常的なアプリケーションに優れたデフォルトとして機能します。最高の精度と深さを必要とする要求の厳しい多段階の問題には、Fugu Ultraが登場します。最高の回答品質のために調整されており、より深い専門エージェントのプールを調整し、1.0Mトークンのcontext windowと131Kトークンのmaximum outputを誇ります。初期のユーザーは、AI研究、論文作成、サイバーセキュリティ分析にこれを使用しています。
同じゲームをせずに勝利する
地政学的な潮流は現在、AIのフロンティアを再形成しており、2026年6月12日にAnthropicのClaude Fable 5とMythos Previewへの一般アクセスを取り消した米国の輸出規制によってそれが顕著に示されています。この動きは、AI sovereigntyへの緊急の需要を喚起し、各国や企業に高度なモデルへの回復力のある、妨げられないアクセスを確保するよう促しています。
2026年6月22日にローンチされたSakana AI AIのFuguシステムは、この要請に直接応えます。Fuguはより大規模なモノリシックモデルではありません。その代わりに、その核となるのは7BパラメータのRL Conductor modelであり、学習されたorchestratorです。このシステムは、多様なLLMのエージェントプール(自身の再帰的なインスタンスを含む)を動的に調整し、すべて単一のOpenAI-compatible APIを介してアクセス可能です。
このmulti-agent architectureは、単一ベンダーへのロックインや地政学的な混乱に対する重要なヘッジを提供します。モデルがブロックされたり利用できなくなったりした場合でも、Fuguは単にそれを迂回し、プール内の他のエージェントを活用することができます。この適応性により、より回復力があり多用途なAIインフラが育成され、フロンティア機能への継続的なアクセスが保証され、企業や国家が技術的独立性を維持できるようになります。その旗艦バリアントであるFugu Ultraは、複雑な多段階の問題で最高の回答品質を達成し、Fuguの戦略的価値をさらに確固たるものにしています。
リーダーボードを席巻する
Fugu Ultraはすぐにその存在感を示し、コードに特化したLLMの動的ベンチマークであるLiveCodeBenchでClaude Fable 5を決定的に凌駕しました。Sakana AI AIのorchestrationシステムは93.2のスコアを達成し、新鮮で汚染が管理された競技プログラミング問題においてFable 5の89.8を上回りました。これは、Fugu Ultraが複雑なコーディング課題に対して強力な支配力を持っていることを示しました。
しかし、Fugu Ultraは普遍的な優位性を主張しませんでした。長期的なソフトウェアエンジニアリングタスク向けに設計されたベンチマークであるSWE-Bench Proでは、Fable 5がリードを維持しました。この違いは、Fugu Ultraの設計上の焦点を明確にしています。Fugu Ultraは個々の複雑なタスクに優れているのに対し、Fable 5は持続的な多段階ソフトウェア開発のために特別に構築されています。
より広範な領域において、Fugu Ultraはその優れた能力を一貫して示しました。Opus 4.8、Gemini 3.1 Pro、GPT 5.5などの他の主要モデルを、コーディング、推論、さらには人文科学を含む幅広い評価で上回りました。これは、そのマルチエージェントオーケストレーションの汎用性を強調しています。そのアーキテクチャの詳細については、Sakana AI Fugu: One Model to Command Them Allをご覧ください。
理論から現実へ:Fuguの活用
Fugu Ultraの能力はベンチマークをはるかに超え、現実世界での目覚ましい有用性を示しています。このシステムは自律的な機械学習研究を実施し、小さなGPTモデルのトレーニングレシピを繰り返し改善しました。単一のH100 GPUで14時間以上をかけ、Fuguは100以上の実験を実行し、バッチサイズ、モデルの深さ、学習率、オプティマイザ設定の改善を自律的に発見しました。このエージェントは、金融時系列予測テストで注目すべき20%のリターンも達成しました。
Enjoying this? Get one like it in your inbox each morning.
one email a day · unsubscribe in two clicks · no third-party tracking
優れた推論と記憶力を発揮し、Fugu Ultraは複雑な認知タスクで優れた能力を発揮しました。目隠しチェスの挑戦では、2100 ELO engineを打ち負かし、その戦略的深さを示しました。さらに、このシステムは機能的なルービックキューブソルバーをゼロから作成することに成功しました。これは、競合するフロンティアモデルが実行可能なソリューションを継続的に生成できなかった偉業です。
抽象的な問題解決を超えて、Fugu Ultraは空間的および構造的推論において目覚ましい熟練度を示しました。CADで完全に機能する機械式アイリスを生成しました。これは複雑なエンジニアリング設計です。これは、同じタスクに対して欠陥のある、または機能しない設計しか生成できなかった競合モデルとは対照的であり、実用的な生成設計におけるFugu Ultraの独自の能力を強調しています。
よくある質問
Sakana Fugu Ultraとは何ですか?
Sakana Fugu Ultraは単一のモノリシックなAIモデルではありません。「指揮者」として機能するマルチエージェントオーケストレーションシステムであり、複雑な問題を解決するために、専門化されたAIモデルのプールにサブタスクをインテリジェントに委任します。
Fugu UltraはClaude Fable 5のようなモデルをどのように凌駕していますか?
Fugu Ultraの強みは、タスクの各部分に最適なAIエージェントを選択する能力にあります。さまざまなモデルの強みを組み合わせ、その弱点を回避することで、LiveCodeBenchのような特定の複雑なベンチマークで優れたパフォーマンスを達成します。
Fuguのアーキテクチャの戦略的利点は何ですか?
そのアーキテクチャは、単一のモデルプロバイダーへの依存を減らすことで「AI主権」を促進します。輸出規制やその他の問題により1つのモデルが利用できなくなった場合でも、Fuguは単にタスクをプール内の他のエージェントにルーティングできるため、回復力が確保されます。
Fugu Ultraはあらゆる面でClaude Fable 5よりも優れていますか?
いいえ。Fugu Ultraは複雑な多段階タスクの多くのベンチマークで優れていますが、Claude Fable 5は非常に長期間にわたるエージェントタスク向けに特別に設計されており、この能力をテストするSWE-Bench ProのようなベンチマークではFuguを依然として上回っています。
