OpenAIエージェントキット：2025年にスウォームに代わるマルチエージェントフレームワーク

💡

TL;DR / Key Takeaways

OpenAIの非推奨となったSwarmフレームワークが再び注目されていますが、あなたが思っている理由ではありません。マルチエージェントAIの革命を静かに支えている、製品準備完了の後継者「AgentKit」を発見してください。

スワームの幽霊：なぜ死んだフレームワークがトレンドになっているのか

スウォームハイプが再びXで爆発しており、OpenAIが死んだフレームワークを密かに復活させたからではありません。ソーシャルメディアをスクロールすれば、「スウォームスタイル」のエージェントがコードレビュー、リサーチスプリント、エンド・ツー・エンドのワークフローを行っているバイラルなクリップが見つかり、各クリップは数千の「いいね」やAI開発者による引用ツイートを獲得しており、次の生産性の鍵を追い求めています。

混乱は単純なミスマッチから生じています：ブランド名と現実の違いです。インフルエンサーたちはOpenAI Swarmの名前を何度も挙げ、「Swarm Update」という謎の更新をちらつかせていますが、これらのデモの背後にある実際のエンジンは、2024年の実験ではなく、OpenAIの新しいエージェントプラットフォームであるAgentKitなのです。

Swarm自体は、2024年にOpenAIが発表した小さな、ほぼおもちゃのようなオーケストレーションフレームワークでした。これは、古いチャット完了APIを使用して、100行未満のPythonコードで複数のステートレスエージェントを接続し、バトンのように一つのエージェントから別のエージェントへ制御を渡す方法を示しました。

そのミニマリズムは、Swarmをハッカーや教育者にとっての魅力的な存在にしました。単一のファイルをざっと読み込むだけで全体のシステムを理解し、数分で例をフォークすることができましたが、一方で、何か真剣なものを上に載せて実行しようとすると厳しい制限に直面しました。

Swarmは、商業用グレードの基本要素なしで出荷されました。内蔵メモリはなく、構造化されたトレースもなく、安全ガードレールも、再試行やエスカレーション、人間の介入によるチェックポイントのための意見のあるパターンもありません—ただの単純なプロンプトの引き渡しといくつかのルーティングロジックだけです。

2025年3月までに、OpenAIはその状況を静かに公式化しました：Swarmは廃止され、棚上げされました。文書と開発者リレーションは人々をより新しいエージェントSDKに向けて指し示し、最終的にAgentKitの下に位置するより堅牢な基盤となるものでした。

クリエイターたちが2025年のスウォームアップデートについて話すとき、彼らが主に言及しているのはバイブスであり、バージョンの更新ではありません。スウォームフレームワークというフレーズは、元のコードベースが進化を止めた後も、マルチエージェントのオーケストレーションの略語として定着しました。

実際に2025年後半にゲームを変えたのは、AgentKitの登場でした。OpenAIはオーケストレーション、安全性、可視性、統合を1つのスタックにまとめました。これには、ビジュアルビルダー、ドロップインチャットUI、そして200以上のサービスを備えたコネクタレジストリが含まれています。

今日のハイプサイクルは、そのスタックに焦点を当てており、2024年のゾンビレポではありません。スウォームは物語の中の幽霊であり、参照点としては有用ですが、今の本当のプロットはその遥かに強力な精神的後継者のものです。

エージェントキットをご紹介します：OpenAIの真のマルチエージェントプレイ

AgentKitは2025年10月6日にDevDayに登場しました。これは、Swarmが解決できなかった質問に対するOpenAIの答えです。それは、デモの外で崩れないマルチエージェントシステムをどのように構築するかということです。Swarmが巧妙なGitHubリポジトリであったのに対し、AgentKitは実際の製品、実際のユーザー、そして実際のSLAの中で機能するように設計されたフルスタックのプラットフォームです。

Swarmは設計上、プロトタイプのままでした。100行未満のPythonで無状態エージェントを接続し、古いチャット完了APIを使用しましたが、メモリレイヤー、トレーシング、ほとんど安全機能がありませんでした。AgentKitは、可視性、ポリシー、スケーリングに関する意見が反映されたデフォルト設定を導入し、チームがハッカソンから生産環境に移行する際に、フレームワークを途中で変更することなく進められるようにします。

中心には、Figmaに似たドラッグアンドドロップのキャンバスであるビジュアル エージェントビルダー が位置しています。開発者は、プランナー、ツール、リトリーバー、評価者、そして人間のチェックポイントをノードとして連結し、それらのフローを他のソフトウェア成果物と同様にバージョン管理、テスト、プロモートします。

エージェントビルダーは、Swarmがユーザーに残した複雑なインフラも組み込んでいます。長期メモリストアを定義し、ツールスキーマを設定し、MCPサーバーを接続し、グラフレベルでガードレールを配置することで、ワークフロー内のすべてのエージェントがデフォルトで同じ安全性とロギングスタックを継承します。

ChatKitは、そのワークフローを配送可能なUXに変えます。チームにアプリ対応のチャットサーフェスを提供します—ウェブコンポーネント、モバイルSDK、デザイントークン—これにより、同じエージェントグラフが内部コンソール、顧客向けのコパイロット、または埋め込みウィジェットをパワーアップでき、毎回フロントエンドを再構築する必要がありません。

下部では、ChatKitがセッション状態、ユーザーのアイデンティティ、およびマルチテナントの隔離を管理しています。これは、単一のデプロイメントが何千もの同時ユーザーと、異なる権限、ツール、データスコープを持つ数十種類のエージェントに対応する可能性がある場合に重要です。

コネクターレジストリは、エージェントキットがすべてのスワームインスパイア型クローンから離れる場所です。OpenAIは、Dropbox、Google Drive、Slack、Microsoft Teams、Salesforce、Jira、GitHub、Snowflakeなどのシステムに対応した200以上のプラグアンドプレイコネクタを提供し、すべてを中央ワークスペースから管理します。

手動でOAuthフローや脆弱なAPIラッパーを作成する代わりに、チームはコネクタをオンにし、役割やフィールドをマッピングし、特定のエージェントに対してそれらのツールを即座に公開します。ポリシー管理や監査ログも同時に機能し、セキュリティチームは実際に生産データへのマルチエージェントアクセスを承認できるようになります。

統合すると、Agent Builder、ChatKit、およびConnector Registryは、これまでエージェントAIを特徴づけてきた断片化に取り組みます。AgentKitは、カスタムスクリプト、UIシェル、統合の接着剤の広がりを置き換え、1つの明確なスタックで多エージェントの実験を安定したサポート可能なソフトウェアに変えることを目指します。

レゴからロジスティクスへ：AgentKitで構築する

AgentKitのエージェントビルダーは、IDEのようではなく、ノーコードの自動化スタジオのように見えます。開発者はプランナー、ツール、リトリーバー、評価者のブロックをキャンバスにドラッグして、レゴブロックのように組み合わせます。内部では完全なエージェントグラフにコンパイルされますが、表面上では色付きのノードを再配置しているだけで、非同期コールバックや脆弱なグルーコードを juggling しているわけではありません。

以前は何百行ものオーケストレーションロジックを必要としたワークフローが、今では1つの画面に収まります。ユーザーの問い合わせをプランナーにルーティングし、いくつかの専門エージェントに振り分けて、それぞれの結果を最終的な応答に集約することができます。グラフ上のすべてのエッジが明示的であるため、マルチエージェント間のハンドオフのデバッグがはるかにブラックボックスではなくなります。

ヒューマン・イン・ザ・ループのガードレールは、このキャンバス内に直接配置されています。人間が行動を承認したり、ツールの呼び出しにサインオフしたり、エージェントの決定を覆す必要があるレビューのチェックポイントを設定します。APIゲートウェイでモデレーションを後付けするのではなく、視覚的にエスカレーションルートをモデル化します：「リスクが高い場合は、一時停止して法務に連絡する。」

力はコネクタレジストリから来ており、これはエージェントの機能のためのアプリストアのように機能します。OpenAIは、以下の領域を網羅して200以上のプラグアンドプレイのインテグレーションを提供しています： - Dropbox、Google Drive、Boxによるファイルアクセス - Slack、Teams、メールによるコミュニケーション - Salesforce、HubSpot、さまざまなCRMによる顧客データ - GitHub、Jira、CIツールによるエンジニアリングワークフロー

エージェントビルダーでは、コネクタをノードにバインドすることで、「リサーチ」エージェントがDropboxからPDFを引き出し、「サポート」エージェントがCRMに問い合わせを行えるようにします。OAuth、シークレットのローテーション、およびスコープは、環境変数や特注スクリプトに散乱することなく、レジストリで一元管理されます。

エージェントグラフが機能すると、ChatKitはそれをユーザーが触れるものに変えます。開発者は、ブランド、役割、権限を完全にコントロールしながら、ウェブアプリ、内部ダッシュボード、またはモバイルクライアントにChatKitウィジェットを埋め込むことができます。単一のChatKitインターフェースは、異なる意図を裏側の異なるエージェントにルーティングできるため、「この請求書を返金する」は静かに財務自動化をトリガーし、「このデッキを要約する」はナレッジワーカーエージェントに届きます。

より詳しい技術的な情報については、OpenAI自身の解説であるAgentKitの紹介 - OpenAI公式をご覧ください。この資料では、これらのコンポーネントとその生産制約について詳しく説明しています。

戦いのために設計された：エンタープライズグレードの安全性と評価

趣味のプロジェクト向けに構築されたSwarmは、監査人やコンプライアンスチームを気にする必要がありませんでした。しかし、AgentKitはそうはいきません。OpenAIは、エージェントのためのエンタープライズグレードのコントロールプレーンとして提案しており、安全性、可視化、最適化が最初のAPIコールから組み込まれており、後から追加されるものではありません。

Swarmは「100行未満のコード」として出荷されますが、AgentKitにはポリシーが付属しています。すべてのリクエストとツールの呼び出しは、組織全体のルールを強制するガードレールを通過します：エージェントがアクセスできるデータ、接続できるコネクター、そして人間の承認なしにどれだけ積極的に行動できるかが定められています。

データプライバシーはGitHubの例から厳格な要件へと進化します。AgentKitは個人識別情報（PII）のマスキングを組み込み、チームがエージェントをデバッグする際に顧客データが観測パイプラインに漏れないよう、トレースやログから自動的にメールアドレス、電話番号、アカウントID、その他の識別子を削除します。

Xの脱獄ミームは、はるかに厳しい実行環境に遭遇します。AgentKitは、プロンプト、中間的な思考、およびツールの出力に対して層状の脱獄検出を実行し、プロンプトインジェクションの試み、役割の乗っ取り、およびデータ流出パターンを多エージェントのワークフローに広がる前にブロックします。

開発者が奇抜な出力をスクリーンショットで共有する代わりに、AgentKitは統合されたEvalsフレームワークに依存しています。チームは評価セットを定義し、それをエージェントやツールに対して実行し、プロンプト、ルーティングロジック、またはモデルを調整しながら時間の経過とともに実行結果を比較できます。

重要な点は、これらの評価が生産トレースに直接結びついていることです。開発者は以下のことができます： - プランナー、リトリーバー、ツールを通じて、エージェントのすべてのステップをトレースする - 自動または人間の採点者からのスコアを添付する - 顧客セグメント、ユースケース、またはモデルバージョン別にパフォーマンスを分析する

そのフィードバックループは次のフェーズ、強化ファインチューニングを設定します。2025年11月、OpenAIはRFTベータ版を展開し、チームが合成ベンチマークではなく、実際のトレースに基づいてカスタム推論戦略とツール使用ポリシーを最適化できるようにしました。

RFTは単にプロンプトを促すだけではありません。モデルがより良いツールを選択し、コールのシーケンスをより効率的に行い、不必要なステップをスキップするようにトレーニングします。初期の内部テストでは、エージェント特有の信号を調整することにより、04 Miniが複雑でツールを多く使用するワークフローにおいて最大30%トークン効率が向上することが示されています。

それらをすべて組み合わせると、AgentKitは開発者のおもちゃのように見えなくなります。インフラに見えるのです。

ヒプから現実へ：企業が今日勝利を収める方法

ハイプサイクルは請求書を支払いません; 製品を出荷することが重要です。AgentKitはすでに概念実証段階を越えており、実際の企業は静かにそれをビジネスの重要な部分に組み込んでいます。その部分では遅延、稼働率、そしてコストが実際に重要なのです。初期採用者からの数字は、実験デモのようではなく、むしろプレイブックのように見えます。

決済処理業者Rampは最も明確な例です。内部のエンジニアリングコパイロットをAgentKitのマルチエージェントスタックで再構築することにより、Rampはイテレーションサイクルをおよそ70%短縮したと報告しています。これは、機能実験、バグトリアージ、内部ツールの更新が数週間ではなく数日で進むことを意味しています。エージェントがコードレビュー、回帰チェック、およびドキュメンテーションスレッドを並行して処理するためです。

Rampは、単一のモノリシックアシスタントの代わりに特化型エージェントに依存しています。プランナーエージェントは作業をサブタスクに分解し、ツーリングエージェントはCI/CDおよび可観測性APIにアクセスし、ドキュメンテーションエージェントは仕様書や変更履歴をリライトします。AgentKitのコネクタレジストリがこれを統合し、各エージェントが同じコードリポジトリ、チケッティングシステム、およびログと連携できるようにし、脆弱な統合レイヤーを必要としません。

Codaは顧客側にも同様に力を入れています。AgentKitを使用して、同社は約3分の2の受信サポートチケットを自動化し、複雑なケースのみを人間にルーティングしています。ルーチンの問題—請求に関する混乱、ワークスペースへのアクセス、基本的なテンプレートに関する質問—は、トリアージエージェント、ナレッジベースを参照するリトリーバルエージェント、そして不確実なものをフラグ付けするエスカレーションエージェントを通じて処理されます。

重要なのは、Codaが人間を流れに保ちながらも彼らを圧倒しないことです。エージェントは返答を作成し、関連する文書を提示し、解決策を提案します。サポート担当者はそれを承認、調整、または上書きします。組み込まれた評価と安全対策が、正確性、妄想率、および顧客満足度スコアを監視し、システムが静かに漂流するのではなく改善されるようにします。

これらのメトリクス—エンジニアリングサイクルが70%速く、チケット自動化が66%—を総合すると、AgentKitは単なる華やかな開発おもちゃから脱却し、運用の負担を大規模に削減するための再現可能で測定可能なツールキットに変わります。

エージェントAIの波：これは単なるツール以上のものです

AgentKitの盛り上がりは、2025年のより大きなシフトの一部です。AIは、単一の万能モデルから、協力し合う専門エージェントのネットワークへと移行しています。計画、ツールの使用、検証を一手に引き受ける巨大なプロンプトの代わりに、チームは計画エージェント、研究エージェント、実行エージェント、そして最適な進路を協議する批評家を立ち上げています。

スーパーコンピュータではなく、アリのコロニーを思い浮かべてください。複数のエージェントがさまざまな角度から問題に取り組み、部分的な進捗を共有し、ひとつの大規模なシステムがすべてを一度で推論するよりも迅速に解決策にたどり着きます。

研究者たちは、LLM群に対して「蟻のコロニー」スタイルの最適化を正式に行っています。11月10日のarXiv論文では、マルチエージェントの探索、フィードバック、投票ループが、特に複雑な推論やコードタスクにおいて、より少ない失敗回数でより高品質な解決策に到達できることが示されました。

その問題は、追加のエージェントが計算オーバーヘッドを増加させることです。各ハンドオフはトークンの増加、処理すべきコンテキストの増加、保存するトレースの増加を意味します。単純なスワームは、ユーザーのリクエストごとに何十ものサブ決定や再試行が発生し、レイテンシとコストを膨らませます。

次世代モデルはその苦痛を和らげ始めています。GPT-5のマルチモーダルスタックは、エージェント間で共有されたコンテキストを維持し、効率的に呼び出しをルーティングし、中間的な推論を圧縮することで、スワームが単純に問題を力任せに解決することを防ぎます。OpenAIは、RFTの下で04 Miniがすでにマルチステップワークフローにおいて30%よりトークン効率が良いと主張しています。

業界の数字が、なぜ多くの企業がここで競争しているのかを裏付けています。トレーディング会社からの内部ベンチマークによると、ジェンセンのスウォームサンプリングアプローチは量子報酬を94%向上させ、早期採用者は単独エージェントから調整されたチームに移行することで、実験サイクルが5〜10倍速くなると報告しています。

コンサルティング会社はこれを取締役会の言葉に定義しています。マッキンゼーは、能動的AIを「テクノロジーの最前線」と呼び、多エージェントシステムが期待通りに成熟すれば、AI駆動のワークフローが現在の企業プロセスの約3%から2025年末までに25%に跳ね上がると予測しています。

エコシステムは同時に断片化し加速しています。AnthropicのMPCツールは、わずか6ヶ月で200以上のコミュニティ構築コンポーネントに急増しました。一方、DeepSeekやLlama 3などのオープンソースのプレイヤーは、OpenAIのキュレーションされたAgentKitよりも透明性があり、ハッカブルなスタックを追求しています。

低レベルの制御を求める開発者は、元のSwarmのアイデアを掘り下げ続けており、OpenAI Swarm - GitHubリポジトリは、エージェントキットやその仲間たちが生産の未来を定義する中で、軽量オーケストレーションの歴史的な青写真として機能しています。

オープンソースのアリーナ：エージェントキット vs. 世界

AgentKitはOpenAIの新しいエンジンかもしれませんが、2016年のKubernetesのような競争の激しい分野に登場しています。開発者たちはすでに二分されています。OpenAIのAgentKitの壁の中に留まるか、次のDevDayの基調講演で古びることのないオープンでモデル非依存のスタックに賭けるかです。

AnthropicのMPCエコシステムは、デフォルトの対抗力となりました。モデルコンテキストプロトコルを基に構築されたMPCは、ツール、データソース、さらには全体のバックエンドを、準拠したエージェントが呼び出せるネットワークアドレス可能な機能に変えます。6ヶ月間で200以上のオープンツールが立ち上げられたことは、エージェントキットのキュレーションされたコネクタレジストリや、意見のあるエージェントビルダーとは非常に異なる哲学を示しています。

AgentKitはバッテリー内蔵のオーケストレーションを約束する一方で、MPCはコンポーザビリティを提供します。Claude、GPT-5、またはローカルのLlamaモデルをMPCを使用して同じワークフローに接続できます。この柔軟性は、2025年3月にOpenAIがSwarmを非推奨にし、全てのユーザーを新しいエージェントSDKスタックに移行させたことで、既に移行に苦しんでいるチームに魅力的です。

ベンダーロックインはもはや抽象的な懸念ではなく、週ごとにXの議論になっています。開発者たちはAgentKitが以下の要素を密接に結びつけていると指摘しています： - モデルの選択 - オーケストレーションロジック - テレメトリと評価 - コネクタとホスティング

後から切り替えることは、プロンプトだけでなく、全体のワークフロー、トレース、そして安全ポリシーを再構築することを意味します。MPC優先の支持者たちは、オープンプロトコルを採用すれば、エージェントのロジックを取り除くことなく、モデルやホスティングプロバイダーを交換できると反論しています。

オープンソースの挑戦者たちはその主張を強化しています。Deepseekは、GPT-4.1やGPT-4.5に対してトークンあたりの価格で下回る、積極的に最適化された低コストモデルを推進しています。それでも、コードのリファクタリングやログのトリアージ、ドキュメントのルーティングなど、多くのエージェントワークにとって「十分に良い」とされています。数千の同時エージェントを運用しているチームにとっては、30〜40％のコスト差が数ポイントのベンチマークよりも重要です。

Llama 3—ソーシャルスレッドではしばしばLlama 3と誤って綴られますが、それでも事実上のオープンモデルブランド—は異なる戦略を基盤としています：自分のGPUまたはVPC上での自己ホスト型エージェント。この道は、データの居住地、レイテンシー、およびファインチューニングに対する完全なコントロールと引き換えに、AgentKitの洗練された安全スタックと評価を放棄します。金融や医療の企業はますますAgentKitでプロトタイプを作成し、その後要件が安定するとLlamaベースのスタックに移行します。

これらすべては、AgentKitを馴染みのある役割に押し上げます。それは、最終目的地ではなく、実際のものを最も早く出荷する方法です。2025年のエージェントAIの波において、開発者にとって賢い選択は、ポータビリティを考慮して設計することです。AgentKitを、唯一の選択肢ではなく、より広範でプロトコル駆動のエコシステムの中の強力なエンドポイントとみなすべきです。

開発者のジレンマ：AIゴールドラッシュの落とし穴

30日間のAI戦争サイクルは、実際にその爆風範囲に出荷する立場になると興奮を感じるものです。エージェンティックスタックは今や、創業者たちがソーシャルや投資家のために「スワームハイプエクスプローズ」の瞬間を求める中、GitHubのリポジトリから「プロダクション」へと週末に移動します。品質、テスト、基本的な可観測性は、デモの後ろに大きく遅れをとることが多いです。

マルチエージェントシステムは、すべての鋭い隅を増幅させます。単一のエージェントが誤認識するのは悪いですが、5つのエージェントが部分的な真実を渡し合うことで、静かにワークフロー全体を蝕む可能性があります。開発者は、エージェントが互いの出力を誤解したり、タスクを誤ルートしたり、同じサブゴールにループしたりするため、ますます「ステージングでは動いていた」という失敗を報告しています。

微妙な幻覚は、単なる奇妙なモデルバグではなく、構造的な問題となります。プランニングエージェントは、存在しないツールを創造したり、APIフィールドを作り出したり、与えられていない権限を推測したりすることがあります。群れの中では、これらのエラーが広がります。ある実行者はプランナーを信頼し、リトリーバーは実行者を信頼し、最終的な応答は洗練されて見えますが、カジュアルなテストでは見過ごされる間違いを含んでいます。

この混乱をデバッグするのは独自の disciplina です。非自明なマルチエージェントワークフローは、リクエストごとに数千のトレースイベントを生成する可能性があります：ツール呼び出し、リトライ、プランナー修正、サブ意思決定、エージェント間メッセージ。開発者たちは、単一のサポートチケットが自律的に解決されるのではなくエスカレートした理由を理解するために、5,000行のトレースをスクロールすることについて語ります。

レイテンシも急増します。追加のエージェントのホップごとに、モデルのレイテンシ、ネットワークの往復、ツールのオーバーヘッドが加わります。徹底したプルーニング—エージェントの削減、計画の深さの制限、攻撃的なキャッシング—がない場合、チームは3秒で始まったワークフローが30秒以上に延び、実際のユーザートラフィックが発生すると完全にタイムアウトするのを目の当たりにします。

スケーリングは、これらのイライラを障害に変えます。10人のユーザーがマルチエージェントフローを利用するのは魅力的ですが、10,000件の同時セッションは以下のような問題を引き起こす可能性があります： - 突然のトークンコストの急騰 - ツールAPIのレート制限の嵐 - サービス全体に波及するキューのバックログ

機会は依然として膨大です。マルチエージェントシステムは、コードレビューのパイプラインからL2サポートのトリアージに至るまで、すでにいくつかのチームの生産性を10倍にしています。しかし、ゴールドラッシュのメンタリティは、これらのエージェント群が自身の複雑さの下に崩壊しないように保つために必要な可視性、評価、そして厳格な単純化がどれほど重要であるかを隠しています。

未来は群れだ：2026年の姿

Swarmは死んだかもしれませんが、2026年はその名前にふさわしい姿を見せるようです。AIエージェントはユニバーサルUIレイヤーになる道筋にあり、アプリやAPIの上に位置し、ブラウザがHTMLの上に座るのと同様です。あなたは「Figmaを開く」や「Jiraにログインする」といった作業をするのではなく、ワークスペースエージェントに望む成果を伝え、それがすべてを調整するのを見守ることになります。

エージェント経済は、そのエージェントが単発のコ-pilotから持続的なサービスとして行動し始めると現実味を帯びてきます。専門化されたエージェントの群れが次の作業を担うリポジトリを想像してください： - CIの失敗や不安定なテスト - 依存関係のアップグレードやセキュリティパッチ - 回帰テストのトリアージやロールバック本当に新しい問題が発生しない限り、人間がコマンドラインに触れることなく行われます。

それはサイエンスフィクションではなく、現在の動向を示しているのです。今日、AgentKitを生産ワークフローに組み込んでいる企業は、基本的に2026年の自律メンテナンスチームを育てているのです。OpenAI Platform - Agents Documentationのようなドキュメントは、SDKのノートというよりも新しいオペレーションレイヤーの仕様書のように感じられます。

メタが報告した約700億ドルの設備投資は、最も顕著な兆候です。そのような大金をデータセンターに注ぎ込むのは、少しだけ良いニュースフィードのランキングを維持するためではありません。惑星規模のエージェント群をホストし、商取引、モデレーション、創造ツール、内部の自動化を人間が主要なオペレーターではなく例外処理者となるレベルで実現するためです。

1年後、複雑なデジタルインフラはAIチームによって運営されるマルチプレイヤーゲームのように見え始めます。1つのエージェントクラスターはKubernetesを管理し、別のクラスターはリアルタイムでクラウド支出を最適化し、さらに別のクラスターはサービス間のAPI契約を交渉します。人間はポリシーを設定し、ダッシュボードを確認し、エージェントが意見を異にしたり逸脱したりしたときに介入します。

2025年がマルチエージェントシステムの有効性を証明する年であったなら、2026年はそれらがインターネットの退屈な部分を静かに引き継ぐ時代となるでしょう。

次の一手：観ているだけではなく、作り始めよう

スクロールやSwarmスレッドの更新をやめましょう。リポジトリを作成し、AgentKitを開いて、毎日繰り返す面倒なタスクを行う小さなエージェントを設定してください：GitHubの課題を整理したり、PRレビューのチェックリストを生成したり、インシデントレポートを要約したりします。1週間で簡易的な内部ツールをリリースし、その後の週でログや評価、実際のユーザーを加えて強化しましょう。

AgentKitはノスタルジアを狙ったものでも、隠れたSwarm Updateでもありません。AgentKitはエンジンです：エージェントビルダー、ChatKit、コネクターレジストリ、そしてクオリティ評価スタックが揃っています。これにより、素晴らしいデモが持続可能なシステムに変わります。Swarmはラフスケッチでしたが、AgentKitはプロダクションパイプラインです。

エージェントを業務の採取者ではなく、力を倍増させる存在として扱いましょう。エージェントを既存のワークフローに組み込んでいるチームは、すでに2倍から10倍の成果を上げています：サポートキューが自動解決され、CIノイズがフィルタリングされ、人間が起きる前に営業のフォローアップが下書きされています。マッキンゼー風の予測は別として、MTTR、サイクルタイム、1人あたりのチケット数といった自社の指標が、このスタックが機能しているかどうかをすぐに教えてくれます。

開発者のための実践的な次のステップ：

1明確な指標を持つワークフローを1つ選択してください：SLA、バックログのサイズ、リードタイム。
2エージェントビルダーを使用して、プランナー、ツール呼び出し実行者、そして人間の承認ステップを連携させてください。
3コネクターレジストリから2つまたは3つのデータソースに接続してください、20ではなく。
4評価をオンにし、初日から採点を追跡してください。

テクノロジーリーダーにとっての問題は「スワームにするかしないか」ではなく、「エージェント層を導入するか現状を維持するか」です。60～90日の任期、実際の予算、明確なKPIを持った小規模なタイガーチームを立ち上げてください。主要なプロセスのコストを30％削減するか、新しい人員を増やさずにスループットを倍増させることを目指します。ベンダーロックイン、プライバシー、およびコンプライアンスのレビューを最終スプリントではなく最初のスプリントに組み込んでください。

ムーンショットは必要ありません。生産中のエージェントが必要です。この月にAgentKitを使って何か小さなものを作り、何がうまくいかなかったかを共有し、みんながあなたを抜きにした未来を決める前に、マルチエージェントシステムがどのようであるべきかについて議論に参加しましょう。

よくある質問

OpenAIエージェントキットとは何ですか？

AgentKitは、2025年10月に発表されたOpenAIの本番対応ツールキットであり、マルチエージェントAIシステムの構築、展開、管理を行うためのものです。ビジュアルビルダー、チャット統合ツール、およびコネクタレジストリが含まれています。

AgentKitはOpenAI Swarmの新しいバージョンですか？

いいえ。Swarmは2025年3月に廃止された実験的なフレームワークです。AgentKitは、リアルワールドの生産ワークフローのために構築された、まったく新しく、より強力でエンタープライズグレードの後継です。Swarmのアップデートではありません。

マルチエージェントAIシステムとは何ですか？

マルチエージェントシステムは、単独のエージェントでは対処できない複雑な問題を解決するために、複数の専門化されたAIエージェントが協力する仕組みです。彼らはチームのように協力し、タスクを分担し、情報を共有します。

今日からAgentKitを使い始めることができますか？

はい、AgentKitは2025年10月6日のOpenAIのDevDayで発表され、開発者がエージェントワークフローを構築・展開できるようになりました。RampやCodaのような企業はすでに本番環境で使用しています。

𝕏 in ↑↗

OpenAIのエージェントキットがスウォームを打ち倒した