公開日: 2026 年 3 月 11 日
2 月に、WebMCP が早期プレビュー プログラムで利用可能になったことをお知らせしました。ブラウザで AI エージェントが普及するにつれて、ウェブ デベロッパーから次のような質問が寄せられるようになりました。 「WebMCP は Model Context Protocol(MCP)に取って代わるのでしょうか?」
この質問をされた理由については理解できますが、誤解に基づいています。エージェント エクスペリエンスを作成するために、MCP と WebMCP のどちらかを選択する必要はありません。WebMCP は MCP の拡張機能や代替機能ではありません。WebMCP と MCP は、それぞれ異なるニーズに対応しています。WebMCP を使用すると、アプリケーション機能の目的を明確にし、ブラウザ エージェントにウェブサイトを操作するための追加機能を提供できます。
たとえば、企業のカスタマー サービス コールセンターと店舗の専門家の違いを考えるとわかりやすいでしょう。
- MCP は、任意のプラットフォームでいつでも利用できます。必要に応じてデータを取得し、コアタスクを処理できます。
- WebMCP はウェブサイトでのみご利用いただけます。ウェブサイトは通常、人間向けに設計されたユーザー インターフェース(UI)であり、マシン向けではありません。WebMCP は、エージェントが UI をよりよく理解するのに役立ちます。
これらを組み合わせることで、エージェントは人間のユーザーに代わってパーソナライズされたタスクを実行できます。
機能と目的
どちらのテクノロジーも、アプリケーションがツールを AI エージェントに公開するための標準化された信頼性の高い方法を作成するという同じ哲学を共有しています。
実際には、次のような内容が含まれます。
- 構造化されたツール検出: エージェントが「何ができる?」と質問し、利用可能なツール、そのパラメータ、目的の明確なリストを取得するための、マシンで読み取り可能な方法を提供します。
- 予測可能な実行: 推測を明示的な関数呼び出しに置き換えます。エージェントが定義されたツールを呼び出します。これにより、クリック パターンが変化する可能性のあるシミュレーションとは異なり、予測可能な結果が得られます。
- 明確なインテント: 明示的に機能を宣言します。WebMCP と MCP がない場合、エージェントは UI の理解に基づいて取るべきアクションを推測します。WebMCP と MCP を使用すると、エージェントは UI 要素からアクションを推測する必要がなく、特定の機能がどのように動作するかを確実に把握できます。
主な違いは、アプリケーション機能がどこに存在するのかです。
MCP はバックエンド用です
Model Context Protocol(MCP)は、AI エージェント(ブラウザベースかどうかを問わず)をデータソース、ツール、ワークフローなどの外部システムに接続する標準です。このプロトコルは汎用的で、多くの場合 JSON-RPC を使用し、Rust、Python、TypeScript などの言語固有の SDK を介して実装されます。
WebMCP はフロントエンド用です
WebMCP は、ブラウザの組み込みエージェントのみとやり取りする 2 つの API を備えた、提案中のブラウザ標準です。これらの API は、JavaScript または HTML 属性で実装できます。ブラウザは、ウェブサイトとエージェント間の通信手段として機能します。
WebMCP は、MCP の直接的な JavaScript 実装ではなく、MCP にインスパイアされた API のセットと考えることができます。WebMCP はブラウザ専用に構築されており、リソースなど、さまざまなサーバーサイドのコンセプトが省略されています。
エージェントがウェブサイトにアクセスする方法を制御する
WebMCP を使用すると、エージェントがウェブサイトとやり取りする方法を制御できます。これには次のようなメリットがあります。
- 速度と信頼性: WebMCP はブラウザの内部システムを使用するため、クライアントとツールの間の通信はほぼ瞬時に行われます。リモート サーバーへのラウンド トリップを待つ必要はありません。
- 長持ちするように構築: WebMCP ツールは、設計ではなくアプリケーション ロジックに接続します。つまり、エージェントがウェブサイトを正しく操作する機能を損なうことなく、ウェブサイトを再設計できます。
- 制御が可能: エージェントがクリックする適切なボタンを見つけることを期待するのではなく、エージェントがサイトを操作する優先方法を明確に定義します。エージェントが理解できる方法でアプリケーションのロジックを定義し、UI からアクションを推測するのではなく、直接エージェントをガイドします。
UI へのアクセスを制御する
この違いを理解するには、「誰が UI を所有しているか」を考えてください。MCP アプリは、エージェントの UI 内でアプリケーションの UI をレンダリングします。インターフェースはこれらの制約に準拠する必要があり、新しい別のアプリケーションが必要です。
WebMCP を使用すると、エージェントは既存のウェブサイトとリアルタイムでやり取りできます。ライブ ブラウザタブでのみ利用可能なライブ セッション データ、Cookie、DOM 要素にアクセスできます。アプリケーションがエージェント内のゲストになるのではなく、エージェントがプラットフォームのゲストになります。
重要なのは、WebMCP ツールは一時的なものであるということです。ページが開いている場合にのみ存在します。ユーザーがサイトから移動したり、タブを閉じたりすると、エージェントはサイトにアクセスしたり、アクションを実行したりできなくなります。
WebMCP と MCP を使用する
特定の機能や関数に適切なソリューションを選択する際は、コンテキストと可用性を考慮してください。
| MCP | WebMCP | |
|---|---|---|
| 目的 | エージェントがいつでもどこでもデータとアクションを利用できるようにします。 | ユーザーがサイトにアクセスしたときに、エージェントとすぐにやり取りできるように、ライブ ウェブサイトを準備します。 |
| Lifecycle | 永続(サーバーとデーモン) | 一時的(タブにバインド) |
| 接続 | グローバル(パソコン、モバイル、クラウド、ウェブ) | 環境固有(ブラウザ エージェント) |
| UI 操作 | ヘッドレスと外部 | ブラウザ統合型で DOM を認識 |
| ファインド | エージェント固有の登録フロー | ユーザーがウェブページにアクセスしたときに登録されたツール。 |
| ユースケース | バックグラウンドで API アクションを実行します。 | ライブ ウェブ UI を操作します。 |
最も効果的なエージェント アプリケーションでは、MCP と WebMCP の両方を使用して、両方のテクノロジーの強みを活用します。
- MCP でコアロジックを管理する: MCP サーバーは基盤となるサービスレイヤとして機能します。コア ビジネス ロジック、データ取得、バックグラウンド タスクを処理します。これにより、サービスがプラットフォームに依存せず、エージェントが常に利用できるようになります。
- WebMCP でコンテキスト UI を構築する: WebMCP は最終ステップであり、エージェントをウェブサイトに直接接続します。コンテキストに応じたブラウザ内でのやり取りを想定しており、ユーザーがウェブサイトを開いている間に、エージェントがユーザーに代わって迅速かつ確実に操作できます。
MCP と WebMCP は対立するものではなく、パートナーとして捉えてください。WebMCP は、ブラウザベースの AI エージェントがユーザーのタブに表示される特定のワールドとやり取りするための高忠実度の方法を提供します。
次のステップ
ウェブサイトをエージェント対応にする準備はできましたか?WebMCP の試験運用は、今すぐ早期プレビュー プログラムに登録することで開始できます。
この標準の今後の改善を進めるうえで、皆様からお寄せいただくフィードバックが非常に重要です。