このAIは公開するには危険すぎる

Anthropicの新しいAIは27年間隠されていたバグを発見し、同社はそれを公開することを拒否しています。これがソフトウェア開発を永遠に変える理由がここにあります。

Hero image for: このAIは公開するには危険すぎる
💡

TL;DR / Key Takeaways

Anthropicの新しいAIは27年間隠されていたバグを発見し、同社はそれを公開することを拒否しています。これがソフトウェア開発を永遠に変える理由がここにあります。

彼らがあなたから隠しているAI

Anthropicは、あまりにも強力なAIモデルを発表したため、同社はそれを公にリリースすることを拒否しています。この前例のない決定は、テクノロジー業界にとって極めて重要な転換点となり、人工知能の能力が従来の安全パラダイムを超越する新時代の到来を示唆しています。

Claude Mythos Previewと名付けられたこのモデルは、12の主要なテクノロジー企業からなる強力な連合体であるProject Glasswingを主導しています。1億ドル以上のコミットされたクレジットを投入し、その唯一の目的は、インターネットを支える重要なソフトウェア内のセキュリティ脆弱性を特定し、修正することです。参加している巨大企業は以下の通りです。 - Apple - Microsoft - Google - Amazon - Crowdstrike - The Linux Foundation

Mythosはすでに、長年にわたり人間の専門家や自動化ツールをすり抜けてきた何千ものゼロデイ脆弱性を自律的に発見しています。これには、セキュリティで名高いオペレーティングシステムであるOpenBSDの27年前のバグや、数百万回の事前テストを受けてきたシステムであるFFMPEGのH264 codec内の16年前の脆弱性が含まれます。これらの発見の深さと古さは、Mythosの比類ない分析能力を際立たせています。

独立系開発者がプロジェクトのセキュリティ確保に奔走する状況から、多国籍企業が重要なインフラを保護する状況まで、テクノロジーエコシステム全体への影響は即座かつ甚大です。これは単なる漸進的なアップグレードではなく、デジタルセキュリティと悪用との間の軍拡競争における地殻変動を表しています。

この前例のない能力は、明確な二律背反を提示します。インターネットを根本的に安全にするのに十分強力なツールでありながら、その基盤を解体することも同様に可能です。最も深い欠陥を発見し修正するために設計されたそのAIは、悪意のある者の手に渡れば、まったく新しい種類のデジタル脅威を生み出す兵器となり、サイバー戦争の様相を永遠に変える可能性があります。

Project Glasswingの秘密同盟の内部

イラスト: Project Glasswingの秘密同盟の内部
イラスト: Project Glasswingの秘密同盟の内部

AnthropicのProject Glasswingは、蔓延するデジタル脅威に対抗する強力な同盟として、12の主要なテクノロジー企業を結集する前例のない秘密の連合体を発表しました。この強力なイニシアチブは、Apple、Microsoft、Google、Amazon、Crowdstrike、The Linux Foundationといった業界の巨人たちと、他のいくつかの重要なインフラプロバイダーを一つにまとめ、すべてが単一の緊急の使命に焦点を当てています。この協力の規模と秘密性は、その認識されている重要性を際立たせています。

これらの企業は、現代インターネットの基盤となるインフラを集合的に所有・運営しており、その関与は不可欠です。クラウドサービスやオペレーティングシステムからウェブプラットフォームやモバイルアプリケーションに至るまで、事実上すべてのデジタルシステムが毎日、彼らの広大なネットワークの少なくとも1つを経由しています。デジタルランドスケープ全体にわたるこの深い統合は、真にエコシステム全体にわたるセキュリティイニシアチブにとって、彼らの協力的な取り組みを極めて重要にしています。

Glasswingの中核には、Anthropicの未公開AIモデルであるClaude Mythos Previewがあります。これは、公開配布するには強力すぎると見なされている先進的なフロンティアモデルです。その明示された使命は、悪意のあるアクターがそれらを悪用する前に、グローバルなデジタルランドスケープ全体でゼロデイ脆弱性を自律的に発見し、パッチを適用するという協調的な防御努力です。この積極的なアプローチは、専門家の人間のチームや従来のツールでさえ見逃す脅威を無力化することを目指しています。

Mythosは、長年検出を免れてきた数千もの未知の脆弱性を特定し、その並外れた能力をすでに実証しています。これには、セキュリティで有名なオペレーティングシステムであるOpenBSD内の27年前のバグや、FFMPEGのH264コーデックにおける16年前の欠陥が含まれます。このような深く埋め込まれた脆弱性は、数百万回にわたる人間および自動テストのサイクルをすり抜けており、AIの比類ない分析の深さと、サイバーセキュリティを再構築する可能性を強調しています。

この連合は、Project Glasswingの集中的な運用に割り当てられた1億ドル以上のクレジットをもって、その深いコミットメントを強調しています。この多額の投資は、このイニシアチブの極めて重要な重要性と、サイバー脅威の増大に対する業界の深刻な懸念を示しています。Mythosの能力を持つAIを内部で展開することは、厳しい認識を反映しています。AIが加速する未来に予測される高度な攻撃に対抗できるのは、高度で協調的な防御のみです。

「破られない」コードが崩壊するとき

Mythosは、重要なインターネットインフラストクチャにおいて数千ものゼロデイ脆弱性を自律的に発見し、ソフトウェアセキュリティに関する長年の信念をすでに打ち破っています。この前例のない分析能力は、何十年も検出を免れてきた欠陥を露呈させ、「セキュアな」コードの定義そのものに異議を唱えています。これらの発見の規模と深さは、脅威インテリジェンスにおける新たな、不穏なフロンティアを強調し、確立されたサイバーセキュリティプラクティスの再評価を強いています。

最も衝撃的な発見の一つとして、Mythosは、揺るぎないセキュリティへの注力で伝説的なオペレーティングシステムであるOpenBSD内に27年前のバグを特定しました。「セキュア・バイ・デフォルト」の哲学と綿密なコード監査で知られるOpenBSDの堅牢性に対する優れた評判は、この特定の発見を特に驚くべきものにしました。この深刻な脆弱性は、世界で最も強固なソフトウェア環境の一つにおいて、数百万時間にわたる人間の精査と高度な自動テストに抗して、ほぼ30年間も存続していました。

同様に不安を煽ることに、Anthropicのモデルは、遍在するFFMPEG H264コーデックに16年前の欠陥を発見しました。この基盤となるコンポーネントは、世界中の無数のビデオアプリケーション、ストリーミングサービス、メディアツールを動かしており、その長年未発見だった弱点は、数十億のデバイスに影響を与える広範なシステムリスクとなっています。デジタルメディア処理の要石であるFFMPEGのバグは、Mythosが深く埋め込まれ、高度に利用されているコードベースに侵入し、その隠れた脆弱性を鮮やかに示しています。

これらは、曖昧でめったに使用されないシステムやニッチなアプリケーションではありません。OpenBSDとFFMPEGはともに、長年にわたり絶え間ない人間のレビュー、形式検証、高度な自動テスト体制を受けてきたソフトウェアエンジニアリングの頂点を表しています。従来の基準で「破られない」と見なされたコードに、このような重大な脆弱性がこれほど長く存続していたという事実は、従来のセキュリティパラダイムにおける根本的かつ深く懸念される限界を浮き彫りにし、不可能と思われていた盲点を明らかにしています。

Mythosがこれらの深く根付いた欠陥を暴いた成功は、以前の人間や機械の能力をはるかに超える、全く新しいレベルの分析能力を示しています。このAIは、複雑なコードパスを推論し、微妙な論理エラーを特定し、何世代にもわたって業界の集合的知性をすり抜けてきた悪用ベクトルを予測する驚くべき能力を実証しました。それは、真にセキュアなソフトウェアを構成するものの閾値を効果的に再定義し、緊急のパラダイムシフトを要求しています。

ベンチマークは秘密主義を正当化するか?

Anthropicの発表には、その前例のない能力を強調するために設計されたClaude Mythos Previewの驚くべき性能指標が含まれていました。このモデルは、ソフトウェアエンジニアリングにおけるAIを評価するための主要なベンチマークであるSWE-bench Proで大幅な向上を達成したと報じられています。さらに、自律的なコマンドライン操作とシステムナビゲーションのための重要な指標であるTerminal-Bench 2.0でも、さらに20%の大幅な飛躍を示しました。これらの進歩により、MythosはAnthropic自身の開発向けAIの現在のリーダーであるOpus 4.6をはるかに超え、実用的なコーディングとシステムインタラクション能力における記念碑的な飛躍を示しています。

このような劇的な改善は、主要なフロンティアモデルのリリース間で通常見られる漸進的な進歩とは対照的です。歴史的に、OpenAIのGPT-4のようなモデルから後続のイテレーションへの移行、またはGoogleのGeminiバージョン間の移行では、しばしば一桁台のパーセンテージ増加にとどまり、段階的な改良を示していました。複数の重要なベンチマークで20%を超える性能向上は、単なる進化ではなく、パラダイムシフトを意味します。この規模の進歩こそが、一般公開するには強力すぎるモデルという物語を助長し、その開発者たちが表明する極度の注意を正当化するものです。

モデルプロバイダーによる自己申告のベンチマークには、健全な懐疑心がつきものです。企業はしばしば、強みを強調するために報告を最適化し、生の数値が根底にある制限や特定のテスト条件を隠すことがあります。特に、世界のサイバーセキュリティ情勢を根本的に変える可能性のあるデュアルユースの示唆を持つAIについて議論する場合、独立した検証がそのような主張を検証するための黄金律であり続けます。いかなる主張も額面通りに受け入れる前に、精査が最も重要です。

この本質的な注意にもかかわらず、Project Glasswing連合の広範さと実力は、Anthropicの主張に大きな重みを与えています。Apple、Microsoft、Googleといったテクノロジーの巨人、さらにAmazon、Crowdstrike、Linux Foundationが直接関与していることは、通常のマーケティングを超えたレベルの内部検証を意味します。

これらのパートナーは、その膨大なリソース、比類のないエンジニアリングの才能、そしてインターネットのコアインフラストラクチャを保護することへの深い利害関係を持って、最も重要なシステム内でMythosを積極的に利用しています。彼らの継続的な関与と1億ドルを超えるクレジットのコミットメントは、これらの性能指標が単なるマーケティングの誇大広告ではなく、すでに何千もの重大な脆弱性の発見につながっているAI能力における具体的で検証可能な飛躍を反映していることを示唆しています。これらの数値は、外部からの精査が必要であるものの、モデルの並外れた能力と、そのアクセスが制限されている理由について説得力のある根拠を確かに構築しています。

AI搭載型攻撃者の夜明け

イラスト:AI搭載型攻撃者の夜明け
イラスト:AI搭載型攻撃者の夜明け

Anthropicは、Apple、Microsoft、Google、Amazonを含む12のProject Glasswingパートナーに対し、未公開のClaude Mythos Previewで重要な先行者利益を与えています。しかし、この独占性は、超加速するAIの状況において、つかの間の優位性しか提供しません。イノベーションの猛烈なペースは、その能力が普及するまでのリードが、年ではなくわずか数ヶ月で測られる、本質的に一時的なものであることを示しています。

歴史は、画期的なAI能力が急速に普及することを示しています。OpenAIと主要な中国のAI研究所は、おそらく数ヶ月以内にMythosの能力を必然的に再現するでしょう。同様に、迅速な研究開発サイクルに支えられた堅牢なオープンソースコミュニティもすぐに追いつき、しばしばプロプライエタリモデルを凌駕します。この急速な収束により、高度なAI駆動型脆弱性発見が長く独占されることはありません。

結果として、サイバー戦争の状況は根本的な変化の瀬戸際にあります。間もなく、すべての主要な悪意あるアクターは、あらゆるソフトウェアに対して高度な脆弱性診断と侵入テストを実行する能力を手にすることになるでしょう。Mythosが、セキュリティで名高いオペレーティングシステムであるOpenBSDで27年前のバグを、あるいはFFMPEGのH264コーデックで16年前の欠陥を発見したように、脅威グループがゼロデイ脆弱性を大規模に自律的に発見し、悪用する様子を想像してみてください。

この民主化された力は、グローバルなデジタルインフラに対する前例のない、システム的な脅威に直結します。手動監査や従来の自動セキュリティ評価のみに依存する時代は終わりました。AIは敵対者に比類のない深さと速度でシステムを調査する力を与え、数十年にわたり人間の専門家や既存のツールを回避してきた弱点を特定し、ソフトウェアの回復力に関する長年の仮定を時代遅れにするでしょう。

すべての既存ソフトウェアの攻撃対象領域は、指数関数的に拡大する準備ができています。以前は堅牢と見なされていたシステムも、容赦ないAI主導の精査に直面し、検出不可能と思われていた脆弱性が露呈するでしょう。開発者は、年次または四半期ごとのチェックリストを超えて、ソフトウェア開発ライフサイクルのあらゆる段階にセキュリティを組み込むため、継続的なセキュリティプロトコルを緊急に統合する必要があります。これはもはや贅沢品ではなく、AIを搭載した攻撃者の夜明けにおける生存のための極めて重要な要件です。

あなたの開発ワークフローは今やセキュリティ上の欠陥です

Mythosの比類なき能力は、ソフトウェアセキュリティを根本的に再定義し、すべての開発ワークフローを潜在的な脆弱性へと変えます。このAIは、以前は数百万もの人間によるテストと自動テストを受けていたシステムであるOpenBSDで27年前のバグを、またFFMPEGのH264コーデックで16年前の欠陥を自律的に発見し、新しいパラダイムを示しています。開発者は今、コードベース全体、たとえ堅牢に見えるコンポーネントであっても、AIを搭載した攻撃者からの新たな、容赦ない精査にさらされているという現実と向き合わなければなりません。

依存関係管理の整合性は、危機的かつ喫緊の懸念事項となっています。Nodeモジュール、Pythonパッケージ、その他広く使用されているオープンソースライブラリは、もはや受動的なコンポーネントではなく、AI主導の悪用の主要な標的です。Mythosの能力を模倣したモデルを活用する悪意あるアクターは、これらのパッケージを積極的に侵害し、洗練されたバックドアやゼロデイ脆弱性を開発環境に直接注入するでしょう。すべての`npm install`または`pip install`は、現在、リスクが高まっており、厳格な出所確認と継続的な監視が要求されます。

セキュリティはもはや受動的な四半期ごとのチェックリストとして機能することはできません。CI/CDパイプライン内にシームレスに統合され、自動化された継続的なシステムへと変革しなければなりません。これは、デプロイ前だけでなく、すべてのコードコミットに対してリアルタイムスキャン、静的解析、動的テストを義務付けます。AIが脆弱性を特定し、兵器化できる速度は、従来の定期的なセキュリティ監査が、この加速する脅威の状況に対して悲惨なほど不十分であることを意味します。

AIコードアシスタントによる生産性向上でさえ、深刻な新たなセキュリティ課題をもたらします。これらの強力なツールは、開発を加速させる上で非常に貴重である一方で、意図せず侵害されたパッケージを取り込んだり、提案したりすることで、プロジェクトに直接脆弱性を注入する可能性があります。開発者がコードの生成と統合のためにLLMにますます依存するにつれて、自動化されたAI強化型セキュリティスキャンは不可欠な防御層となり、生成されたすべての行とインポートされた依存関係を潜在的な欠陥がないか精査します。

高度なAI機能の急速な普及は、Project Glasswingの12のパートナーに与えられた現在の「先行者利益」が一時的なものであり、年ではなく月単位で測られることを意味します。間もなく、同様の脆弱性発見能力は、潤沢な資金を持つ悪意のあるアクターを含め、世界中で利用可能になるでしょう。この差し迫った変化は、ソフトウェア開発ライフサイクルのあらゆる側面を緊急かつ根本的に再評価し、ワークフロー全体を広大で常に進化する攻撃対象領域として扱うことを必要とします。警戒とセキュリティの積極的な統合は、もはや選択肢ではありません。

火には火を:AIを最高の防御策として

AIを搭載した攻撃者の影が大きく迫る一方で、そのような脅威を可能にするまさにその技術が、私たちの最も強力な防御策も提供します。AnthropicのMythosモデルは、数十年前の脆弱性を発見する能力を持ち、複雑なコードベースを分析する比類のない能力を示しています。この固有の強みは、AIを潜在的な武器から、デジタルインフラストラクチャにとって不可欠な盾へと変貌させます。

組織は今、自社のソフトウェアスタックのプロアクティブなセキュリティ監査役として大規模言語モデルを活用しなければなりません。侵害を待つのではなく、企業はAIを展開して弱点を容赦なくスキャンし、悪意のあるアクターが発見する前に欠陥を特定します。この戦略は、AIの深い分析能力を自社のアーキテクチャ内の潜在的なエクスプロイトに対して向けることで、攻撃を未然に防ぎます。

Mythosによる、27年前のOpenBSDのバグと16年前の脆弱性の衝撃的な発見

フロンティアAIの万里の長城

イラスト:フロンティアAIの万里の長城
イラスト:フロンティアAIの万里の長城

AnthropicがClaude Mythos Previewを非公開にすることを決定した前例のない判断は、人工知能開発にとって極めて重要な瞬間を画します。初めて、フロンティアモデルが一般公開するには危険すぎると見なされ、多くの観察者が今や「フロンティアAIの万里の長城」と呼ぶものを築き上げました。この動きは、モデルが数千ものゼロデイ脆弱性を自律的に発見する驚くべき能力によって推進されており、強力なAIの未来について深い疑問を投げかけています。

セキュリティに関する議論は否定できない重みを持っています。Mythos Previewはすでに、OpenBSDの27年前のバグやFFMPEGのH264コーデックにおける16年前の脆弱性など、これまで攻撃に対して堅牢であると考えられていたシステムにおける重大な欠陥を発見しています。Apple、Microsoft、Google、Amazon、Crowdstrike、Linux Foundationを含む12の主要テクノロジー企業にProject Glasswingの下で独占的な早期アクセスを許可することは、インターネットのインフラを強化するための、一時的ではあるものの、重要な先行者利益を提供します。

しかし、この集中的な管理は重大なリスクを伴います。前例のない効率でソフトウェアを分解・再構築できるような計り知れない力を、選ばれたコンソーシアム内に集中させることは、イノベーションと競争に対する潜在的な締め付けを生み出します。これら12社は今や、オペレーティングシステムからクラウドインフラストラクチャに至るまで、デジタル世界の広範な領域におけるセキュリティのペースと方向性を事実上決定しています。

この進展は、ますますオープンソース化され、あるいは一般公開されるフロンティアモデルの最近の傾向とは著しく対照的です。最も高度なAIをより広範なコミュニティと共有し、集団的防御と民主化されたイノベーションを育む時代は、終焉を迎えつつあるようです。Anthropicの姿勢は、特権を持つごく一部の者だけが最も強力なAIツールを使いこなせる未来を示唆しており、最先端の防御策を活用できる者とできない者との間の格差を広げる可能性があります。

AI安全の最適な道筋に関して、根本的な議論が浮上しています。それは、強力な少数の人々が高度なAIに内在する危険から守る中央集権的な管理を通じて最もよく実現されるのでしょうか、それとも、テクノロジーエコシステム全体で集団的な防御を可能にする民主化されたアクセスを通じて実現されるのでしょうか? Project Glasswingの即座のセキュリティ上の利点は明らかですが、このような変革的なテクノロジーへのアクセスを制限することの長期的な影響は、厳密な精査を必要とします。AIの安全性と開発における今後の道筋は、激しく議論され続けています。

希望の光:コードのカンブリア爆発

Claude Mythos Previewを取り巻く差し迫ったセキュリティ上の懸念にもかかわらず、Anthropicの画期的な発表から深い希望の光が見えてきます。重要なソフトウェアに27年前の脆弱性を発見する前例のないAIの力は、ソフトウェア作成に変革をもたらす時代も約束します。この高度な能力は、開発が根本的に民主化され、誰が構築し革新できるかというパラダイムが変化する未来を直接指し示しています。

Mythosのような強力なモデルは、ソフトウェアエンジニアリングにおける従来の参入障壁を打ち破る態勢が整っています。複雑なコーディング言語を習得し、複雑なフレームワークを理解し、デプロイメントパイプラインをナビゲートするという骨の折れるプロセスは、ほとんど抽象化される可能性があります。技術的な詳細からのこの解放は、これまでコーディング要件によって制約されていた膨大な数の新しいイノベーターが、彼らの野心的なアイデアを実現することを可能にするでしょう。

あらゆる分野の専門家にとっての深い意味合いを考えてみてください。経験豊富な都市計画家は、持続可能な都市設計のためのカスタムシミュレーションプラットフォームを迅速に開発でき、医療研究者はゲノム解析のための特注ツールを作成できます。これらすべてを、専門のプログラマーになる必要なく行えます。かつて技術的な実装の課題によってボトルネックとなっていた彼らの深いドメイン知識は、機能的なソフトウェアに直接変換され、イノベーションの主要な原動力となるでしょう。

この根本的な変化は、コードのカンブリア爆発を触媒し、複雑な社会問題に対する斬新な解決策が急速に生まれる環境を育むと予想されます。アクセスしやすいAI開発ツールによって大幅に強化された個人や小規模で機敏なチームは、これまで膨大なリソースと大規模で潤沢な資金を持つエンジニアリング部門を必要とした課題に取り組むでしょう。これらの強力なAI能力によって増幅された人類の集合知は、「Star Trek」に見られる楽観的で問題解決志向の精神を彷彿とさせる未来を設計する準備ができており、そこではテクノロジーがすべての人にとっての進歩と革新への直接的な導管として機能します。

Mythosの現実におけるあなたの次の動き

Project Glasswingを通じたClaude Mythos Previewの出現は、前例のない技術的転換点をもたらします。一般公開するには危険すぎると見なされているこのフロンティアモデルは、比類のないセキュリティ上の脅威と深い創造的な機会を同時に具現化しています。OpenBSDの27年前のバグやFFMPEGのH264 codecにおける16年前の欠陥を含む、数千ものゼロデイ脆弱性を自律的に発見するその実証された能力は、ソフトウェアの整合性に対する私たちの理解を根本的に再構築します。

開発者は、今日からセキュリティ体制を全く新しいレベルの真剣さで扱う必要があります。受動的な脆弱性パッチの時代は終わり、プロアクティブで継続的なセキュリティ統合が今や不可欠です。SWE-bench ProとTerminal-Bench 2.0での大幅な向上を含むMythosのパフォーマンスベンチマークは、急速に一般公開されつつある敵対的AI能力の高度さを示しています。

既存の AI coding tools を防御目的ですぐに試用し始めてください。Anthropic の現在のモデル、GPT、Gemini のようなプラットフォームは、内部の vulnerability scanning、code hardening、および proactive threat modeling のための重要な出発点となります。これらの機能を活用することで、次世代の AI を活用した攻撃者が弱点を悪用する前に、チームがそれらを特定できるようになります。

技術的な状況は不可逆的に変化しました。適応はもはや戦略的な選択肢ではなく、この新しい現実における生存と成功のための前提条件です。Project Glasswing の12のパートナー企業(Apple、Microsoft、Google、Amazonなど)に与えられた初期の先行者利益は、同様の機能が民主化されるにつれて、一時的なものとなるでしょう。

この変化を単なる課題としてではなく、イノベーションの触媒として受け入れてください。「破られない」コードを破壊する恐れのある同じ AI の力は、software development のカンブリア爆発も約束し、クリエイターが前例のない速さで複雑な問題を解決することを可能にします。攻撃と防御の両方における AI との積極的な関与が、あなたの将来の関連性を決定します。

よくある質問

Project Glasswing とは何ですか?

Project Glasswing は、Anthropic が主導する、Apple、Google、Microsoft を含む12の巨大テクノロジー企業の連合体です。その使命は、新しい AI model である Claude Mythos を使用して、インターネットを動かす software における重大な security vulnerabilities を発見し、修正することです。

Claude Mythos とは何ですか?

Claude Mythos は、Anthropic が開発した、未公開の新しい「フロンティア」AI model です。高度な code analysis のために特別に設計されており、これまで知られていなかった security flaws (zero-day vulnerabilities) を自律的に発見する前例のない能力を実証しています。

Claude Mythos はなぜリリースするには危険すぎると考えられているのですか?

複雑で隠れた vulnerabilities を発見するその強力な能力は、もし一般に公開されれば、悪意のあるアクターによって容易に兵器化される可能性があります。これは、critical infrastructure、software、および businesses に対する cyberattacks の大規模な増加につながる可能性があります。

developers は AI-driven security threats にどのように備えるべきですか?

developers は直ちに security practices を強化すべきです。これには、厳格な dependency management、continuous development lifecycle への security testing の統合、そして防御的な AI tools を使用して自身の code の vulnerabilities を監査し始めることが含まれます。

🚀Discover More

Stay Ahead of the AI Curve

Discover the best AI tools, agents, and MCP servers curated by Stork.AI. Find the right solutions to supercharge your workflow.

Back to all posts