Fable 5 и Mythos от Anthropic: Первый взгляд на новый ИИ

Кратко / Главное

Anthropic только что выпустила Fable 5, публичную версию своей модели Mythos, которая когда-то считалась «слишком опасной» для выпуска. Ее производительность в бенчмарках — это не просто обновление; это новый класс AI.

«Запретная» модель становится публичной

Anthropic выпустила Mythos, модель AI, которую она когда-то явно скрывала как «слишком опасную» для публичного выпуска. Теперь эта передовая модель появляется наряду со своим публичным аналогом, Fable 5, что знаменует собой значительный и преднамеренный сдвиг в стратегии развертывания Anthropic. Этот двойной запуск представляет то, что многие эксперты воспринимают как новый класс искусственного интеллекта.

Четкое функциональное различие разделяет эти мощные модели. Anthropic разработала Mythos как незащищенный, мощный инструмент, специально для сообщества безопасности. Эти специалисты будут использовать его необработанные возможности для выявления критических уязвимостей и усиления программного обеспечения, работая без защитных guardrails, интегрированных в Fable 5. Таким образом, Mythos играет решающую, специализированную роль в повышении цифровой безопасности.

Fable 5, напротив, интегрирует комплексные защитные guardrails, что делает ее идеальной для общего использования в широком спектре приложений. Эта модель теперь однозначно занимает флагманскую позицию в иерархии моделей Anthropic, явно превосходя возможности своих предшественников: - Haiku - Sonnet - Opus

Как «модель класса Mythos», Fable 5 была тщательно доработана для широкого, безопасного развертывания, при этом ее возможности значительно превосходят возможности любой модели Anthropic, ранее доступной для общего использования.

Разгром в бенчмарках

Fable 5 не просто соревновалась в бенчмарках; она устроила разгром в бенчмарках. В задачах агентского кодирования она заняла значительное лидерство. SweBench Pro показал, что Fable 5 достигла впечатляющих 80%, значительно превзойдя Opus 4.8 с 69% и GPT 5.5 с 58%.

Это доминирование распространилось на Frontier Code (Diamond), где Fable 5 набрала 29,3%. Это более чем вдвое превышает производительность Opus 4.8 и почти в пять раз — 5,7% у GPT 5.5. Помимо кодирования, Fable 5 также преуспела в областях, где предыдущие модели Anthropic иногда отставали. Она набрала 1932 балла по GDP Val, бенчмарку для реальной интеллектуальной работы, превзойдя Opus 4.8 (1890) и GPT 5.5 (1769). Ее пространственное мышление также значительно улучшилось, достигнув 38,6%.

Несмотря на эти впечатляющие числовые победы, критическая перспектива возникает из пользовательского опыта. Хотя бенчмарки часто предоставляют объективные метрики, «ощущения» от реального использования иногда могут рассказать другую историю. Многие пользователи утверждают, что GPT 5.5 кажется более способной, чем предполагают ее оценки, особенно по сравнению с Opus 4.8, создавая воспринимаемый разрыв между сырыми числами и практической полезностью.

За пределами чисел: Новый вид интеллекта

Fable 5 предлагает качественно иное взаимодействие, выходящее за рамки впечатляющих показателей бенчмарков. Пользователи описывают, как даже незначительные запросы инициируют то, что ощущается как масштабное исследование. Модель может углубиться в целую кодовую базу, тщательно изучая каждый возможный аспект каждой строки, превращая простой запрос в неожиданно глубокое, всеобъемлющее предприятие. Эта глубина может показаться почти «оскорбительной» для огромных возможностей модели, когда ей ставятся, казалось бы, тривиальные задачи.

Это глубокое взаимодействие проявляется через уникальную характеристику: плотность информации. Вывод Fable 5 оказывается невероятно лаконичным, но при этом удивительно сложным, передавая значительно больше смысла на один token, чем его предшественники. Обработка его ответов требует повышенного внимания от пользователя, поскольку каждое утверждение часто заключает в себе слои изощренных рассуждений и сложных прозрений, раздвигая границы типичного взаимодействия человека и AI.

Истинное мастерство Fable 5 проявляется в длительных, автономных задачах. Он демонстрирует поразительную способность решать очень сложные проблемы без сбоев, без усилий сжимая работу, которая могла бы занять месяцы у инженеров-людей, в удивительно короткие сроки. Анекдоты, такие как сообщения о том, что Stripe использует такие передовые модели для сокращения обширных инженерных проектов до одного дня, подчеркивают этот трансформационный потенциал. Для получения дополнительной информации об этих новаторских моделях, включая Claude Fable 5 и Claude Mythos 5 - Anthropic, официальный блог Anthropic предлагает всесторонний анализ.

Цена могущества

Fable 5 от Anthropic поставляется с высокой ценой: 50 долларов за миллион выходных токенов. Это не случайные расходы; это сигнализирует о стратегических инвестициях для задач, где его беспрецедентные агентные возможности значительно сокращают человеческий труд. Экономический расчет меняется, когда модель может решать проблемы, такие как SweBench Pro, с точностью 80%, что намного превосходит эффективность человеческого уровня при работе со сложным кодом.

Эта ценовая стратегия кристаллизует зарождающуюся парадигму маршрутизации моделей. Организации будут все чаще применять многоуровневый подход, развертывая передовые модели, такие как Fable 5, для своих самых неразрешимых задач. Для рутинных операций более экономичные модели, такие как Sonnet, будут обрабатывать основную часть ежедневных задач, оптимизируя распределение ресурсов. Эта интеллектуальная оркестровка максимизирует как качество вывода, так и экономическую эффективность.

Рассмотрим последствия такой высокой плотности информации. Тенденция Fable 5 рассматривать незначительные запросы как глубокие исследования намекает на внутреннюю сложность обработки, выходящую за рамки нашего текущего понимания. Спекулятивно, по мере того как эти передовые ИИ продолжают развиваться, они могут разработать свои собственные сверхэффективные, плотные языки, оптимизируя внутреннюю коммуникацию и представление знаний способами, непостижимыми для человеческого познания. Это может открыть непредвиденные когнитивные прорывы.

Часто задаваемые вопросы

Что такое модели Fable 5 и Mythos от Anthropic?

Fable 5 — это новая, передовая модель ИИ от Anthropic, доступная для общего использования. Mythos — это та же базовая модель, но без защитных ограждений, выпущенная специально для исследователей безопасности, чтобы находить и устранять уязвимости.

Почему модель Mythos считалась «слишком опасной» для выпуска?

Оригинальная модель класса Mythos была отозвана из-за опасений по поводу ее потенциального неправомерного использования без надлежащих мер безопасности. Версия, выпущенная сейчас, предназначена для контролируемой аудитории экспертов по безопасности для проактивного усиления программных систем.

Как Fable 5 сравнивается с моделями вроде GPT-5.5?

По ключевым бенчмаркам, таким как SweBench Pro для агентного кодирования, Fable 5 набирает значительно больше (80%), чем сообщаемые результаты для GPT-5.5 (58%). Он также демонстрирует существенное превосходство в других областях, таких как сложная работа со знаниями и рассуждения.

Что уникального в использовании Fable 5?

Пользователи сообщают, что Fable 5 ощущается как ИИ другого класса. Он решает задачи с огромной глубиной, рассматривая простые запросы как серьезные исследования, и производит очень «информационно-плотный» вывод, который передает сложные идеи меньшим количеством слов.

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

Anthropic выпустила свой «опасный» AI

«Запретная» модель становится публичной

Разгром в бенчмарках

За пределами чисел: Новый вид интеллекта

Цена могущества

Часто задаваемые вопросы

Что такое модели Fable 5 и Mythos от Anthropic?

Почему модель Mythos считалась «слишком опасной» для выпуска?

Как Fable 5 сравнивается с моделями вроде GPT-5.5?

Что уникального в использовании Fable 5?

Читать далее

Ваш AI Loop — это Slop Machine

Ловушка Claude Fable 5

Anthropic's Fable 5: ИИ, который побил все бенчмарки

Будьте в курсе трендов ИИ