WebMCP

Alexandra Klepper
Alexandra Klepper

公開日: 2026 年 5 月 18 日

WebMCP は、AI エージェント用の構造化ツールを構築して公開するためのウェブ標準案です。WebMCP は JavaScript を提供し、HTML フォーム要素にアノテーションを付けます。これにより、エージェントはページ機能とやり取りする方法を正確に把握し、ユーザー エクスペリエンスをサポートできます。これにより、エージェントの動作のパフォーマンスと信頼性が大幅に向上します。

AI エージェントは比較的新しいテクノロジーです。複雑で技術的なタスクを人間がより適切に完了できるよう支援します。WebMCP は、エージェント タスクの完了の精度が高く、プログレッシブ エンハンスメントとして追加できます。

WebMCP を選ぶ理由

WebMCP は、インタラクションのルールを提供することで、ウェブ アプリケーションとエージェント間のギャップを埋め、効率、信頼性、タスク完了を向上させることができます。エージェントがボタンやフィールドなどの要素をレビューしてその目的を理解する代わりに、ウェブサイトが要素の目的を宣言することで、要素が正しく使用されるようにします。

これは、多数のステップがあり、各ステップがエージェントの解釈に委ねられる可能性があるアクチュエーションよりも信頼性が高くなります。

ウェブサイトは、ツールを定義することで、検索や購入などの明確な目的を共有できます。これらのツールはウェブページ上で目に見える形で実行されるため、ユーザーはタスクが期待どおりに完了したことを確認できます。また、ブランドとユーザー中心のデザインの選択もそのまま維持されます。

WebMCP は以下をサポートしています。

  • ディスカバリ: ページが checkoutfilter_results などのエージェントにツールを登録する標準的な方法。
  • JSON スキーマ: 幻覚や誤解を減らすために、入力と想定される出力を明示的に定義します。
  • 状態: 現在のページのコンテキストに関する共通の理解。これにより、エージェントはリアルタイムで操作できるリソースを把握できます。

Google の目標は、エージェント機能を備えたあらゆるブラウザが実装してメリットを得られる API を構築し、ユーザーがタスクをより簡単に完了できるようにすることです。このプロセスは GitHub で確認できます。

ユースケース

ウェブ上で WebMCP を使用する方法はたくさんあります。次に例を示します。

  • お客様がサポートを受けられるようサポートします。お客様にソフトウェアを提供している場合、さまざまな質問に対応するための複雑なサポートフローが必要になることがあります。WebMCP を使用すると、エージェントは適切なフォームにすばやく移動し、ユーザーから提供された情報をフィールドに入力できます。
  • 旅行の予約を改善する。エージェントが複雑な複数都市や複数人数の旅行を少ない手順で予約できるようにします。

購入などの操作は機密情報に該当する場合があります。確認ダイアログでユーザー インタラクションをリクエストするコマンドを含めることができます。

実際には、ツールで次のタスクを実行できます。

  • 構造化されたフォームへの入力: エージェントがユーザーとの会話から収集したデータをフォーム フィールドに正しくマッピングできるようにする submit_application ツールを構築します。たとえば、フィールドに氏名が必要か、姓と名が別々に必要かを区別できます。
  • 人間を優先したインターフェースでのサポート エージェントの操作: 特定のフィールドは人間のユーザー向けに設計されていますが、エージェントには理解できない場合があります。予約やイベントの予約で複雑な日時選択を可能にする date_pick ツールを構築できます。
  • アプリケーションのデバッグを迅速化: デベロッパー設定ページで run_diagnostics ツールを構築できるため、エージェントは、ネストされたメニューの奥に隠れている修正をトリガーできます。

ユースケースが見つからない場合は、WebMCP について共有したいアイデアはありますか?早期プレビュー プログラムに参加して、フィードバックをお寄せください。

始める

WebMCP は、ローカル開発用の Chrome フラグとして利用できます。Chrome 149 のオリジン トライアルで利用できるようになります。

WebMCP をローカルで有効にするには:

  1. Chrome を開いて chrome://flags/#enable-webmcp-testing に移動します。
  2. フラグを [有効] に設定します。
  3. Chrome を再起動して変更を適用します。

WebMCP API を使用する

ウェブサイト ツールを設定するために使用できる API は次の 2 つです。

  • 命令型 API: フォーム入力、ナビゲーション ツール、状態管理などの標準の JavaScript を使用して、さまざまな種類のツールを定義します。
  • 宣言型 API: 標準の HTML フォームにアノテーションを追加して、WebMCP ツールを作成します。

制限事項

WebMCP はエージェントと人間にとって複雑なタスクを簡素化することを目的としていますが、いくつかの制限があります。

  • ブラウジング コンテキストが必要: ツール呼び出しは JavaScript で処理されるため、ブラウザタブまたはウェブビューを開いて、可視インターフェースとブラウザ コンテキストを提供する必要があります。つまり、ヘッドレス状態のツールを呼び出すエージェントや補助ツールはサポートされていません。
  • 複雑なインターフェースのオーバーヘッドが増加する: サイトが非常に複雑な場合は、アプリケーションとインターフェースの**状態**を処理するために、JavaScript を**リファクタリング**または追加する必要がある可能性があります。
  • ツールの検出可能性: 呼び出し可能なツールがあるかどうかを確認するには、クライアントとブラウザがサイトに直接アクセスする必要があります。

デモ

命令型と宣言型の両方の実装をカバーするデモの例は、次のとおりです。

GitHub でデモのソースコードを確認することもできます。

インスペクタ拡張機能を使用してエージェントのチャットを模倣する

Model Context Tool Inspector 拡張機能をインストールして、エージェントを試したり、ライブデモや独自のアプリケーションで WebMCP ツールがどのように動作するかを確認したりできます。自然言語プロンプトを入力して、エージェントが WebMCP ツールを正しく操作できるかどうかを確認できます。

この拡張機能を使用すると、次のことができます。

  • navigator.modelContext API をモニタリングして、ページに登録されているツールを確認します。
  • ツールを手動で呼び出して関数を実行します。
  • JSON スキーマが正しく定義されており、ブラウザがツールが想定する形式でデータを解析できることを確認します。
  • ツールから返された構造化された出力またはエラー メッセージを表示して、エージェントが理解できるように、明確に記述され、正しくフォーマットされていることを確認します。

自然言語を使用してエージェントに話しかけ、適切な WebMCP ツールを正しく識別して呼び出すことができるかどうかを確認します。プロンプトはデフォルトで gemini-3-flash-preview モデルに送信されます。

意見交換とフィードバックの提供

WebMCP は現在活発な議論が行われており、今後変更される可能性があります。これらの API をお試しになり、フィードバックがございましたら、ぜひお聞かせください。