Skip to content

Anthropic's Fable 5: ИИ, который побил все бенчмарки

Anthropic выпустила Claude Fable 5, публичную версию своей легендарной модели 'Mythos'. Она уже доминирует во всех основных бенчмарках и демонстрирует беспрецедентные навыки в сложных, долгосрочных задачах.

Theo Brandt
Hero image for: Anthropic's Fable 5: ИИ, который побил все бенчмарки

Кратко / Главное

Anthropic выпустила Claude Fable 5, публичную версию своей легендарной модели 'Mythos'. Она уже доминирует во всех основных бенчмарках и демонстрирует беспрецедентные навыки в сложных, долгосрочных задачах.

Легенда о Mythos становится реальностью

Anthropic только что выпустила Claude Fable 5, общедоступное, защищенное воплощение легендарной модели 'Mythos'. Этот ИИ когда-то считался слишком мощным для широкого выпуска, окутанный слухами о его необузданной мощи и потенциале "уничтожить весь мир".

Mythos зародилась глубоко в рамках Project Glasswing, тайной инициативы, где она продемонстрировала тревожные возможности. Она продемонстрировала "кибернаступательные возможности уровня национального государства", обнаружив тысячи уязвимостей высокой степени серьезности. Среди них — 27-летняя уязвимость в OpenBSD и 271 ошибка в Firefox — ошеломляюще в десять раз больше, чем у ее предшественника, Opus 4.6. Это была не просто модель; это было цифровое оружие, что потребовало "дополнительных мер безопасности", которые породили Fable 5.

Теперь Anthropic делает свой ход, позиционируя Fable 5 как прямой вызов иерархии ИИ. Она стремится превзойти ведущие модели от OpenAI, Google и даже своего собственного бывшего чемпиона, Claude Opus 4.8. Fable 5 — первая модель, преодолевшая 90% на основном аналитическом бенчмарке Anthropic, что представляет собой скачок на 10 пунктов по сравнению с предыдущими моделями Opus. Она лидирует в SWE-bench Verified leaderboard с результатом 93.9% против 88.6% у Claude Opus 4.8, что сигнализирует о явном намерении Anthropic захватить корону frontier AI.

Бенчмарки не лгут: Коронован новый король

Цифры не лгут. Anthropic's Claude Fable 5 только что подняла планку для возможностей frontier AI, демонстрируя определяющую для рынка производительность по ключевым отраслевым бенчмаркам. Она полностью доминирует над всеми другими моделями на планете, включая Opus 4.8, в таких оценках, как SWE-bench, FrontierCode и GDPval. Эта модель является передовой почти по всем протестированным бенчмаркам возможностей ИИ, превосходя в разработке программного обеспечения, интеллектуальном труде, зрении и научных исследованиях.

Fable 5 достигла значительного прорыва, преодолев 90% на основном аналитическом бенчмарке Anthropic для сложных, длительных аналитических задач. Это представляет собой беспрецедентный скачок на 10 пунктов по сравнению с предыдущими моделями Opus, сигнализируя о новой эре в способности ИИ справляться со сложными, многоэтапными проблемами. Мастерство модели в экономически ценном интеллектуальном труде, оцененное по 44 профессиям и 9 основным секторам в GDPval, приближается к качеству человеческого эксперта.

Мэтью Берман, проницательный наблюдатель за ландшафтом ИИ, не стал подбирать слова после недели работы с моделью, объявив ее "лучшей моделью на планете". Он высоко оценил мастерство Fable 5, особенно в долгосрочных задачах, отметив, что он "не мог найти задач, которые были бы для нее слишком сложными". Берман подчеркнул ее готовность исследовать каждое возможное решение, даже если это казалось "медленным", в конечном итоге приводя к беспрецедентным результатам, таким как моделирование динамики жидкости. Эта модель не просто проходит тесты; она переопределяет потолок возможностей.

За пределами цифр: Освоение долгосрочных задач

Помимо сырых результатов бенчмарков, где теперь царит Claude Fable 5, лежит ее истинное стратегическое преимущество: long-horizon tasks. Это не простые Q&A; они требуют автономного планирования, многоэтапного выполнения и iterative refinement сложных проектов без постоянного вмешательства человека. Архитектура Fable 5 специально разработана для такого устойчивого рассуждения, что является критическим отличием, открывающим новые уровни производительности в реальных приложениях.

Обзор Мэттью Бермана ярко продемонстрировал эту возможность, выделив потрясающую симуляцию гидродинамики, сгенерированную Fable 5. Это не было заранее заготовленной демонстрацией; модель автономно создавала и манипулировала сложной системой в реальном времени, демонстрируя передовые генеративные и рассуждающие способности, намного превосходящие возможности ее предшественников. Это выходит за рамки простого решения проблем; это проактивное управление проектами.

Его методичный подход, часто воспринимаемый как «медлительность», на самом деле является не ошибкой, а особенностью — преднамеренным вложением в тщательность. Fable 5 досконально исследует каждый возможный путь решения, обеспечивая оптимальные результаты, а не быстрые, но субоптимальные. Этот продуманный процесс объясняет, почему это первая модель, преодолевшая 90% на основном аналитическом бенчмарке Anthropic для сложных, длительных задач, что на 10 пунктов выше предыдущих моделей Opus. Для получения более глубокой информации о выпусках моделей Anthropic см. Claude Fable 5 and Claude Mythos 5 - Anthropic.

Мощь против безопасности: стратегический гамбит Anthropic

Anthropic не просто выпускает новую модель; они осуществляют продуманный двойной релиз. Claude Fable 5 выходит в свет с надежными мерами безопасности, модель «Mythos-класса», адаптированная для общего использования. Тем временем полнофункциональный Claude Mythos 5 — без киберзащиты — предназначен для проверенных партнеров Glasswing и конкретных исследователей в области биологии. Речь идет не только о возможностях; это стратегический гамбит, балансирующий необработанную мощь с ответственным развертыванием.

Помните Project Glasswing? Оригинальный Mythos Preview продемонстрировал «кибернаступательные возможности уровня национального государства», выявив тысячи уязвимостей высокой степени серьезности, включая 27-летнюю ошибку в OpenBSD. Anthropic понимает ставки: модель, способная на такие подвиги, требует тщательно контролируемого выпуска, отсюда и двухуровневый подход. Они знают, что у них есть.

Хотите использовать этот новый стандарт? Fable 5 доступен через Claude API и такие платформы, как Bedrock. Ценообразование агрессивное для передовой модели: $10 за 1 миллион входных токенов и $50 за 1 миллион выходных токенов. Это не просто более мощный инструмент; он устанавливает новую отраслевую планку для безопасного развертывания frontier AI, доказывая, что инновации не должны подавляться осторожностью. Anthropic только что показал всем, как это делается.

Часто задаваемые вопросы

Что такое Claude Fable 5?

Claude Fable 5 — это новая, общедоступная модель ИИ от Anthropic. Это модель «Mythos-класса» с передовыми мерами безопасности, разработанная для сложных, долгосрочных задач.

Чем Fable 5 отличается от Mythos 5?

Fable 5 — это версия модели Mythos, сделанная безопасной для общего использования. Полная модель Claude Mythos 5 имеет меньше мер безопасности и ограничена для специализированных партнеров по исследованиям в области безопасности и биологии.

Что делает Claude Fable 5 лучше других моделей?

Fable 5, как сообщается, доминирует в бенчмарках, таких как SWE-bench и GDPval, превосходя даже Claude Opus 4.8. Его ключевая сила — это решение сложных, многоэтапных задач, требующих постоянного рассуждения.

Для кого предназначен Claude Fable 5?

Он предназначен для разработчиков и исследователей, работающих над амбициозными, сложными проблемами, такими как сложное программное проектирование, научные исследования и длительные аналитические задачи, которые могут быть автоматизированы.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀Узнать больше

Будьте в курсе трендов ИИ

Откройте лучшие инструменты ИИ, агенты и MCP-серверы от Stork.AI.

P.S. Сделали что-то полезное? Опубликуйте на Stork