Skip to content

Этот ИИ-дирижер только что превзошел Claude Fable 5

Новый ИИ из Токио превосходит гигантов вроде Claude Fable 5, и это не просто еще одна массивная модель. Fugu Ultra от Sakana AI использует революционную систему «оркестровки», которая может изменить подход к созданию интеллектуальных систем.

Nora Vance
Hero image for: Этот ИИ-дирижер только что превзошел Claude Fable 5

Кратко / Главное

  • Новый ИИ из Токио превосходит гигантов вроде Claude Fable 5, и это не просто еще одна массивная модель.
  • Fugu Ultra от Sakana AI использует революционную систему «оркестровки», которая может изменить подход к созданию интеллектуальных систем.

Граница — это не одна модель

Преобладающая парадигма создания все более крупных, монолитных моделей ИИ уступает место более сложной стратегии. Новая граница включает разработку интеллектуальных систем, которые стратегически координируют несколько специализированных ИИ, обещая повышенную адаптивность и устойчивость к таким вызовам, как геополитический экспортный контроль. Этот архитектурный сдвиг знаменует отход от единых, всеобъемлющих моделей.

В основе этой эволюции лежит Sakana AI AI Fugu, многоагентная система оркестровки. Функционируя как LLM-дирижер, Fugu обучен динамически направлять входящие задачи оптимальному агенту из сменного пула других LLM, включая рекурсивные экземпляры самого себя. Этот обученный оркестратор, работающий на основе модели RL Conductor с 7 миллиардами параметров, автономно управляет выбором модели, делегированием, проверкой и синтезом, представляя единый интеллект из одной конечной точки API.

Sakana AI AI предоставляет Fugu в двух различных уровнях, доступных через единый OpenAI-совместимый API. Базовая модель Fugu сочетает высокую производительность с низкой задержкой, служа отличным вариантом по умолчанию для повседневных приложений, таких как кодирование с Codex или интерактивные чат-боты. Для сложных, многоэтапных задач, требующих максимальной точности и глубины, вступает в игру Fugu Ultra. Настроенный на максимальное качество ответов, он координирует более глубокий пул экспертных агентов, обладая окном контекста в 1.0M токенов и максимальным выходом в 131K токенов. Ранние пользователи применяют его для исследований в области ИИ, создания статей и анализа кибербезопасности.

Победа, не играя по тем же правилам

Геополитические течения теперь меняют границы ИИ, что ярко подчеркивается экспортным контролем США, который отозвал публичный доступ к Claude Fable 5 и Mythos Preview от Anthropic 12 июня 2026 года. Этот шаг вызвал срочный спрос на суверенитет ИИ, вынуждая страны и предприятия обеспечивать устойчивый, беспрепятственный доступ к передовым моделям.

Система Fugu от Sakana AI AI, запущенная 22 июня 2026 года, прямо отвечает этому императиву. Fugu — это не более крупная, монолитная модель; вместо этого, ее ядро — это модель RL Conductor с 7 миллиардами параметров, обученный оркестратор. Эта система динамически координирует пул агентов из разнообразных LLM, даже рекурсивных экземпляров самого себя, все это доступно через единый OpenAI-совместимый API.

Эта многоагентная архитектура обеспечивает важную защиту от привязки к одному поставщику и геополитических сбоев. Если модель становится заблокированной или недоступной, Fugu может просто обойти ее, используя других агентов в своем пуле. Эта адаптивность способствует созданию более устойчивой и универсальной инфраструктуры ИИ, гарантируя непрерывный доступ к передовым возможностям и позволяя предприятиям и странам сохранять технологическую независимость. Fugu Ultra, его флагманский вариант, достигает максимального качества ответов на сложные, многоэтапные проблемы, еще больше укрепляя стратегическую ценность Fugu.

Доминирование в таблицах лидеров

Fugu Ultra немедленно заявил о себе, решительно превзойдя Claude Fable 5 на LiveCodeBench, динамическом бенчмарке для LLM, ориентированных на код. Система оркестровки Sakana AI AI достигла результата 93.2, превзойдя 89.8 у Fable 5 на новых, контролируемых на предмет загрязнения задачах по соревновательному программированию. Это продемонстрировало мощное владение Fugu Ultra сложными задачами кодирования.

Однако Fugu Ultra не претендовал на всеобщее доминирование. На SWE-Bench Pro, бенчмарке, разработанном для задач программной инженерии с длинным горизонтом, Fable 5 сохранил свое лидерство. Это различие проясняет фокус дизайна Fugu Ultra: он превосходно справляется с отдельными сложными задачами, тогда как Fable 5 специально создан для устойчивой, многоэтапной разработки программного обеспечения.

В более широком спектре Fugu Ultra постоянно демонстрировал свои превосходные возможности. Он превзошел другие ведущие модели, такие как Opus 4.8, Gemini 3.1 Pro и GPT 5.5, в широком диапазоне оценок. Они включали бенчмарки для кодирования, рассуждений и даже гуманитарных наук, подчеркивая универсальность его многоагентной оркестровки. Для более глубокого изучения его архитектуры см. Sakana AI Fugu: One Model to Command Them All.

От теории к реальности: Fugu в действии

Возможности Fugu Ultra выходят далеко за рамки бенчмарков, демонстрируя впечатляющую практическую полезность. Система провела автономное исследование машинного обучения, итеративно улучшая рецепт обучения небольшой модели GPT. За 14 часов на одном H100 GPU Fugu провел более 100 экспериментов, автономно обнаружив улучшения в размере пакета, глубине модели, скорости обучения и настройках оптимизатора. Этот агент также достиг заметной 20% доходности в тесте прогнозирования финансовых временных рядов.

Enjoying this? Get one like it in your inbox each morning.

one email a day · unsubscribe in two clicks · no third-party tracking

Демонстрируя превосходные рассуждения и память, Fugu Ultra преуспел в сложных когнитивных задачах. В шахматном состязании вслепую он обыграл движок с рейтингом 2100 ELO, демонстрируя свою стратегическую глубину. Кроме того, система успешно написала с нуля функциональный решатель кубика Рубика, что является достижением, где конкурирующие передовые модели постоянно не могли создать жизнеспособные решения.

Помимо абстрактного решения проблем, Fugu Ultra продемонстрировал замечательное мастерство в пространственном и структурном мышлении. Он сгенерировал полностью функциональную механическую диафрагму в CAD, сложную инженерную конструкцию. Это резко контрастировало с конкурирующими моделями, которые производили только дефектные или нефункциональные конструкции для той же задачи, подчеркивая уникальную способность Fugu Ultra в практическом генеративном дизайне.

Часто задаваемые вопросы

Что такое Sakana Fugu Ultra?

Sakana Fugu Ultra — это не единая, монолитная модель ИИ. Это многоагентная система оркестровки, которая действует как «дирижер», интеллектуально делегируя подзадачи пулу специализированных моделей ИИ для решения сложных проблем.

Как Fugu Ultra превосходит такие модели, как Claude Fable 5?

Сила Fugu Ultra заключается в его способности выбирать лучшего агента ИИ для каждой части задачи. Объединяя сильные стороны различных моделей и избегая их слабостей, он достигает превосходной производительности в конкретных, сложных бенчмарках, таких как LiveCodeBench.

В чем стратегическое преимущество архитектуры Fugu?

Его архитектура способствует «суверенитету ИИ», уменьшая зависимость от одного поставщика моделей. Если одна модель становится недоступной из-за экспортного контроля или других проблем, Fugu может просто перенаправить задачи другим агентам в своем пуле, обеспечивая устойчивость.

Fugu Ultra лучше Claude Fable 5 во всем?

Нет. Хотя Fugu Ultra превосходит многие бенчмарки для сложных, многоэтапных задач, Claude Fable 5 был специально разработан для очень длительных агентских задач и по-прежнему превосходит Fugu в таких бенчмарках, как SWE-Bench Pro, которые проверяют эту возможность.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Узнать больше

Будьте в курсе трендов ИИ

Откройте лучшие инструменты ИИ, агенты и MCP-серверы от Stork.AI.

P.S. Сделали что-то полезное? Опубликуйте на Stork