Skip to content

Anthropicが「危険な」AIを解き放った

Anthropicは、かつて「危険すぎる」として公開が見送られたMythosモデルの一般公開版であるFable 5をリリースしました。そのベンチマーク性能は単なるアップグレードではなく、AIの新しいクラスを確立しています。

Nora Vance
Hero image for: Anthropicが「危険な」AIを解き放った

要約 / ポイント

Anthropicは、かつて「危険すぎる」として公開が見送られたMythosモデルの一般公開版であるFable 5をリリースしました。そのベンチマーク性能は単なるアップグレードではなく、AIの新しいクラスを確立しています。

「禁断の」モデルが一般公開へ

Anthropicは、かつて「危険すぎる」として一般公開を明示的に見送っていたAIモデルである**Mythosを解き放ちました。現在、このフロンティアモデルは、その一般公開版であるFable 5**と共に登場し、Anthropicの展開戦略における重要かつ意図的な転換を示しています。この二重のローンチは、多くの専門家が新しいクラスの人工知能と認識しているものを導入します。

これらの強力なモデルは、明確な機能的区別によって分けられています。AnthropicはMythosを、特にセキュリティコミュニティ向けに、保護されていない強力なツールとして設計しました。これらの専門家は、Fable 5に統合されている安全ガードレールなしで動作し、その生の能力を活用して重要な脆弱性を特定し、ソフトウェアを強化します。Mythosは、デジタルセキュリティを強化する上で不可欠な専門的役割を果たします。

対照的に、Fable 5は包括的な安全ガードレールを統合しており、幅広いアプリケーションでの一般利用に最適です。このモデルは現在、Anthropicのモデル階層において間違いなく旗艦の地位を占め、その前身モデルの能力を明らかに超えています。 - Haiku - Sonnet - Opus

「Mythosクラスのモデル」として、Fable 5は広範かつ安全な展開のために細心の注意を払って改良されており、その能力はこれまで一般公開されたどのAnthropicモデルの能力をも大幅に上回っています。

ベンチマークでの圧倒的勝利

Fable 5はベンチマークで競い合っただけでなく、ベンチマークを圧倒しました。エージェント型コーディングタスクでは、大きなリードを確立しました。SweBench Proでは、Fable 5が驚異的な80%を達成し、Opus 4.8の69%とGPT 5.5の58%を大幅に上回りました。

この優位性はFrontier Code (Diamond)にも及び、Fable 5は29.3%を記録しました。これはOpus 4.8の性能の2倍以上であり、GPT 5.5の5.7%のほぼ5倍です。コーディング以外でも、Fable 5は以前のAnthropicモデルが時に遅れをとっていた分野でも優れていました。実世界の知識作業のベンチマークであるGDP Valでは1932点を獲得し、Opus 4.8 (1890)とGPT 5.5 (1769)を上回りました。その空間推論能力も劇的に向上し、38.6%に達しました。

これらの印象的な数値的勝利にもかかわらず、ユーザーエクスペリエンスからは批判的な視点も生まれています。ベンチマークは客観的な指標を提供することが多い一方で、実際の使用感(「雰囲気」)は異なる物語を語ることがあります。多くのユーザーは、特にOpus 4.8と比較した場合、GPT 5.5がそのスコアが示唆するよりも有能だと感じており、生の数値と実用性の間に認識された乖離が生じています。

数字を超えて:新しい種類の知能

Fable 5は、印象的なベンチマークの数字を超えた、質的に異なるインタラクションを提供します。ユーザーは、些細なリクエストでさえ、大規模な探索のように感じられるものが開始されると述べています。モデルはコードベース全体を深く掘り下げ、すべての行のあらゆる可能な角度を綿密に精査し、単純なプロンプトを予期せぬほど深く、包括的な作業に変えることがあります。この深さは、一見些細なタスクを与えられた場合、モデルの広大な能力に対してほとんど「侮辱的」に感じられることさえあります。

この深遠な関与は、独自の特性である情報密度を通じて現れます。Fable 5の出力は、驚くほど簡潔でありながら非常に複雑で、先行モデルよりもトークンあたりに格段に多くの意味を伝達します。その応答を処理するには、ユーザーからの高い集中力が求められます。なぜなら、各ステートメントはしばしば洗練された推論と複雑な洞察の層を内包しており、典型的な人間とAIのインタラクションの境界を押し広げるからです。

Fable 5の真の能力は、長期間にわたる自律的なタスクで発揮されます。非常に複雑な問題を滞りなく解決する驚異的な能力を示し、人間のエンジニアが数ヶ月かかるような作業を驚くほど短い期間に圧縮します。Stripeがこのような高度なモデルを活用して大規模なエンジニアリングプロジェクトを1日に凝縮したという逸話は、この変革的な可能性を際立たせています。これらの画期的なモデルに関する詳細については、Claude Fable 5 and Claude Mythos 5 - Anthropicを含め、Anthropicの公式ブログで包括的な分析が提供されています。

力の代償

AnthropicのFable 5は、100万出力トークンあたり50ドルという高額な価格設定で登場します。これは気軽な出費ではなく、その比類ないエージェント能力が人間の労働を劇的に削減するタスクに対する戦略的投資を示唆しています。モデルがSweBench Proのような問題を80%の精度で解決できる場合、複雑なコードにおける人間レベルの効率をはるかに超えるため、経済計算が変化します。

この価格戦略は、モデルルーティングという新たなパラダイムを具体化します。組織は、最も困難な課題に対してFable 5のようなフロンティアモデルを導入し、階層的なアプローチをますます編成するでしょう。日常業務には、Sonnetのようなより費用対効果の高いモデルが日々のタスクの大部分を処理し、リソース配分を最適化します。このインテリジェントなオーケストレーションは、出力品質とコスト効率の両方を最大化します。

このような高い情報密度の意味合いを考えてみてください。Fable 5が些細な要求を深い探求として扱う傾向は、現在の私たちの理解を超えた内部処理の複雑さを示唆しています。推測するに、これらの高度なAIが進化し続けるにつれて、人間には理解できない方法で内部コミュニケーションと知識表現を最適化する、独自の超効率的で密度の高い言語を開発する可能性があります。これは、予期せぬ認知的な飛躍を解き放つかもしれません。

よくある質問

AnthropicのFable 5とMythosモデルとは何ですか?

Fable 5は、Anthropicの新しい最先端AIモデルで、一般利用が可能です。Mythosは、同じ基盤モデルですが、安全ガードレールがなく、セキュリティ研究者が脆弱性を発見し修正するために特別にリリースされました。

Mythosモデルはなぜ「リリースするには危険すぎる」と見なされたのですか?

元のMythosクラスモデルは、適切な安全管理なしでの悪用の可能性に関する懸念から公開が見送られました。現在リリースされているバージョンは、セキュリティ専門家という管理された対象者向けに、ソフトウェアシステムを積極的に強化することを目的としています。

Fable 5はGPT-5.5のようなモデルとどのように比較されますか?

エージェントコーディングのためのSweBench Proのような主要ベンチマークにおいて、Fable 5はGPT-5.5の報告されたスコア(58%)よりも大幅に高いスコア(80%)を記録しています。また、複雑な知識作業や推論などの他の分野でも大きなリードを示しています。

Fable 5を使用する上での独自性は何ですか?

ユーザーは、Fable 5が異なるクラスのAIのように感じると報告しています。それは、単純な要求を主要な探求として扱い、非常に深い洞察をもってタスクに取り組み、より少ない言葉で複雑なアイデアを伝える、非常に「情報密度の高い」出力を生成します。

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀もっと見る

AI最前線をキャッチアップ

Stork.AIが厳選したAIツール、エージェント、MCPサーバーをご覧ください。

P.S. 使えるものを作りましたか? Storkに掲載