Skip to content

AIがあなたのウェブサイトを使う方法を学習中

WebMCPと呼ばれる新しいウェブプロトコルは、AIエージェントにウェブサイトを直接使用する方法を教えており、スクリーン・スクレイピングは不要です。しかし、新しい開発者ツールによってその性能は2倍になったものの、まだ解決策の半分に過ぎません。

Theo Brandt
Hero image for: AIがあなたのウェブサイトを使う方法を学習中

要約 / ポイント

WebMCPと呼ばれる新しいウェブプロトコルは、AIエージェントにウェブサイトを直接使用する方法を教えており、スクリーン・スクレイピングは不要です。しかし、新しい開発者ツールによってその性能は2倍になったものの、まだ解決策の半分に過ぎません。

脆い自動化の終わり?

ウェブをナビゲートするAIエージェントは、しばしば脆い視覚ベースの自動化に苦戦します。ピクセル位置やDOM構造に依存するスクリーン・スクレイピングやUI自動化は、わずかなウェブサイトの更新でも壊れてしまいます。この脆いアプローチは、エージェントの信頼性とスケーラビリティを制限し、デジタルサービスと真にインタラクトする可能性を妨げています。

WebMCP、すなわちWeb Model Context Protocolが登場しました。これは、エージェントによるウェブブラウジングに革命をもたらすために設計された、初期段階のブラウザ標準です。このプロトコルは視覚的な解析を超え、ウェブサイトがその機能を構造化された「ツール」としてAIエージェントに直接公開することを可能にします。これにより、インタラクションは推測から明示的なAPIのような通信へと移行します。

ウェブサイトは、document.modelContextオブジェクトを介してこれらのツールを登録することでWebMCPを実装します。開発者は、明確な説明と型付きの入出力スキーマを持つJavaScript関数を定義でき、堅牢で機械可読なインターフェースを作成します。これにより、AIエージェントは「カートに商品を追加する」や「レストランの予約をする」といったアクションを意味的に理解し、呼び出すことができます。

これは単なる傍流の実験ではありません。GoogleとMicrosoftはW3C内でWebMCPを積極的に推進しています。現在、Chrome 146+のオリジントライアル中で、将来のAI駆動型ウェブインタラクションの基盤レイヤーを構築するための真剣で協調的な取り組みを表しています。WebMCPは、インターネット全体でインテリジェントで信頼性の高いエージェント統合の新時代を切り開くことを約束します。

エージェント対応ウェブへの二つの道

WebMCPは、開発者にウェブアプリケーションをエージェント対応にするための二つの異なる経路を提供します。この二重のアプローチは、シンプルなフォームから複雑でステートフルなシステムまで、ウェブの多様なニーズを認識しています。どちらの方法もAIが利用できる構造化されたツールを公開しますが、異なる開発パラダイムに対応しています。

オリジナルの命令型APIは、JavaScriptで開発者に力を与えます。`document.modelContext.registerTool()`を使用することで、アプリケーションはツールをプログラム的に登録し、ツール名、説明、パラメーターを細かく制御できます。この方法は、「Philly's Finest」レストランの注文システムや複雑なOpenSCAD CADモデリングのように、利用可能なアクションがユーザーインタラクションやアプリケーションの状態によって変化するような、非常に動的な環境で優れています。

強力な新しい宣言型APIは、ローコードの代替手段を提供します。開発者は、特定の属性をマークアップに直接埋め込むだけで、標準的なHTMLフォームをAIが読み取れるようにすることができます。これによりJavaScriptの必要がなくなり、プロセスが大幅に効率化されます。

`tool name`、`tool description`、`tool param description`のような属性は、ツールの目的とその入力パラメーターを定義します。ブラウザはこれらのアノテーションを自動的に構造化されたスキーマに変換し、カスタムコードを一切書くことなく、シンプルなToDoリストのようなフォームをAIエージェントが即座に利用できるようにします。

この二重戦略は、計り知れない柔軟性を提供します。シンプルなデータ入力フォームを構築する場合でも、洗練されたエンジニアリングアプリケーションを構築する場合でも、WebMCPはウェブインタラクションがAIエージェントによって正確に理解され、実行されることを保証します。これは、人間中心のUIと機械が実行可能なインターフェースとの間のギャップを埋めます。

新しいDevToolsでAIをデバッグする

ChromeのdevtoolsWebMCPサポートを搭載し、この初期段階の標準が概念的なフレームワークから具体的でデバッグ可能な現実へと変貌しました。この重要な追加は成熟点を示し、開発者がウェブサイトがインテリジェントエージェントに機能をどのように公開するかを正確に検査し、洗練することを可能にします。これにより、エージェント指向のウェブの約束が実用的で出荷可能な開発ワークフローに根付き、AIインタラクションをきめ細かく制御できるようになります。

「Application」パネル内に新しいWebMCPタブが追加され、サイトのエージェント向けインターフェースに対する前例のない可視性を提供します。開発者は以下のことが可能になります。 - 命令型または宣言型のいずれかで定義されたすべての登録済みツールを確認できます。 - 名前、説明、パラメーターを含む正確なスキーマを検査し、AIとの正確なコミュニケーションを確保できます。 - ツール呼び出しの包括的な履歴を確認し、エージェントのインタラクションとその順序を理解できます。 この詳細レベルは、予期せぬエージェントの動作を診断するために不可欠です。

この深い内省は、複雑なエージェントの動作をデバッグし、公開された関数の正確性を検証する上で非常に貴重です。さらに、このパネルでは開発者がツールを直接手動で実行し、特定のパラメーターでAIの呼び出しをシミュレートできます。この機能により、迅速な検証が可能になり、ツールが期待どおりに機能すること、および公開されたスキーマがエージェントに対するサイトの意図されたインタラクションを正確に表していることを確認でき、フィードバックループが加速されます。プログラムによるツール登録の詳細については、WebMCP Imperative API - Chrome Developersをご覧ください。

「50%完璧」問題

最近の進歩にもかかわらず、WebMCPは古典的な「50%完璧」問題を体現しています。Jack Herringtonが述べたように、新しいdevtoolsや簡素化された宣言型APIを含む最近の進歩は、プロトコルを実質的に2倍優れたものにしました。しかし、それはエージェント指向のウェブを可能にするための完全なソリューションの半分に過ぎません。

決定的に欠けている半分は、ブラウザに直接組み込まれたAIアシスタントへのネイティブ統合です。GoogleのGeminiやMicrosoftのCopilotのようなモデルが、これらの公開されたWebMCPツールを積極的に発見して使用しなければ、このプロトコルには意味のあるエンドユーザーアプリケーションがありません。開発者はツールを登録してデバッグできるようになりましたが、現在のところ、実際のタスクにそれらを活用できるブラウザAIはありません。

これはエコシステムにとって重要な疑問を提起します。なぜGoogleのような企業はWebMCPのためにブラウザ側のAPIと洗練されたdevtoolsを構築しているのに、同時にこれらの機能を自社の主力AI製品に接続できていないのでしょうか?ブラウザとAIのインタラクションを再定義すると約束するテクノロジーを立ち上げながら、必要なインフラストラクチャの半分しか提供しないことは、ロケットを発射台に置き去りにするようなものです。

よくある質問

WebMCP(Web Model Context Protocol)とは何ですか?

WebMCPは、ウェブサイトがその機能を構造化されたツールとして公開することを可能にする、新しいウェブ標準です。これにより、AIエージェントは、不安定なスクリーン・スクレイピングに頼るのではなく、APIを呼び出すようにサイトと確実にインタラクションできるようになります。

WebMCPの命令型APIと宣言型APIの違いは何ですか?

命令型APIは、複雑なアプリでの動的なツール登録にJavaScript(`document.modelContext.registerTool()`)を使用します。新しい宣言型APIは、シンプルなHTML属性を使用して、既存のフォームをJavaScriptなしでAI互換にします。

なぜビデオはWebMCPを「50%完璧」と呼んでいるのですか?

ウェブサイトがツールを公開するための技術は急速に向上していますが(最初の50%)、残りの半分が欠けています。GeminiやCopilotのような主要なAIアシスタントはまだWebMCPを統合しておらず、ユーザーが実際にそれから恩恵を受ける方法がないことを意味します。

開発者はWebMCPのテストをどのように開始できますか?

開発者はChrome Flags (`chrome://flags`) でWebMCPのサポートを有効にできます。これにより、DevToolsに新しいパネルがアクティブになり、ウェブサイトが公開しているツールを検査、デバッグ、手動で実行できます。

Found this useful? Share it.

One short daily email of tools worth shipping. No drip funnel.

one email a day · unsubscribe in two clicks · no third-party tracking

🚀もっと見る

AI最前線をキャッチアップ

Stork.AIが厳選したAIツール、エージェント、MCPサーバーをご覧ください。

P.S. 使えるものを作りましたか? Storkに掲載