Veröffentlicht am 18. Mai 2026
WebMCP ist ein vorgeschlagener Webstandard, mit dem Sie strukturierte Tools für KI Agenten erstellen und bereitstellen können. WebMCP bietet JavaScript und annotiert HTML-Formularelemente, damit Agenten genau wissen, wie sie mit Seitenfunktionen interagieren müssen, um die Nutzererfahrung zu verbessern. Dadurch kann die Leistung und Zuverlässigkeit der Agentenaktivierung erheblich verbessert werden.
KI-Agenten sind eine neuere Technologie. Sie können menschlichen Nutzern helfen, hochkomplexe und technische Aufgaben besser zu erledigen. WebMCP bietet eine höhere Genauigkeit bei der Erledigung agentischer Aufgaben und kann als Progressive Verbesserung hinzugefügt werden.
Vorteile von WebMCP
WebMCP kann Ihnen helfen, die Lücke zwischen Webanwendungen und Agenten zu schließen und so die Effizienz, Zuverlässigkeit und Aufgabenerledigung zu verbessern, indem es Regeln für die Interaktion bereitstellt. Anstatt dass ein Agent das Element, z. B. eine Schaltfläche oder ein Feld, überprüft, um seinen Zweck zu verstehen, deklariert die Website den Zweck des Elements, damit es richtig verwendet wird.
Das ist zuverlässiger als die Aktivierung, die zahlreiche Schritte umfassen kann und bei der jeder Schritt vom Agenten interpretiert werden muss.
Websites können einen expliziten Zweck wie Suche oder Kauf angeben, indem sie ein tool definieren. Tools werden auf Ihrer Webseite sichtbar ausgeführt, sodass Nutzer darauf vertrauen können, dass Aufgaben wie erwartet erledigt werden. Außerdem bleiben Ihre Marke und Ihre nutzerorientierten Designentscheidungen erhalten.
WebMCP unterstützt Folgendes:
- Erkennung: Eine Standardmethode für Seiten, um Tools bei Agenten zu registrieren, z. B.
checkoutoderfilter_results. - JSON-Schemas: Explizite Definitionen von Eingaben und erwarteten Ausgaben, um Halluzinationen oder Missverständnisse zu reduzieren.
- Zustand: Ein gemeinsames Verständnis des aktuellen Seitenkontexts, damit der Agent weiß, welche Ressourcen in Echtzeit verfügbar sind.
Unser Ziel ist es, APIs zu entwickeln, die von jedem Browser mit agentischen Funktionen implementiert und genutzt werden können, damit Ihre Nutzer Aufgaben einfacher erledigen können. Sie können diesen Prozess auf GitHubverfolgen.
Anwendungsfälle
Es gibt viele Möglichkeiten, WebMCP im Web zu verwenden. Beispiel:
- Kunden bei der Suche nach Support unterstützen. Wenn Sie Kunden eine Software anbieten, haben Sie möglicherweise einen komplexen Supportablauf, um viele verschiedene Fragen zu beantworten. Mit WebMCP kann ein Agent schneller zum richtigen Formular navigieren und Felder mit von Nutzern bereitgestellten Informationen ausfüllen.
- Reisebuchungen verbessern. Agenten können komplexe Multistop-Flüge und Reisen mit mehreren Passagieren in weniger Schritten buchen.
Einige Aktionen sind möglicherweise vertraulich, z. B. ein Kauf. Sie können einen Befehl einfügen, um eine Nutzerinteraktion mit einem Bestätigungsdialogfeld anzufordern.
In der Praxis können Ihre Tools folgende Aufgaben erledigen:
- Strukturierte Formulare ausfüllen: Erstellen Sie ein
submit_applicationTool, mit dem Agenten Daten, die aus der Unterhaltung mit dem Nutzer erfasst wurden, korrekt Formularfeldern zuordnen können. Sie können beispielsweise unterscheiden, ob ein Feld einen vollständigen Namen oder einen separaten Vor- und Nachnamen erfordert. - Agenteninteraktionen in nutzerorientierten Oberflächen unterstützen: Bestimmte Felder sind
für menschliche Nutzer konzipiert, werden aber möglicherweise nicht von Agenten verstanden. Sie können ein
date_pick-Tool erstellen, das eine komplexe Auswahl von Datum und Uhrzeit bei einer Reservierung oder Buchung von Veranstaltungen ermöglicht. - Schnellere Fehlerbehebung bei Anwendungen: Sie können auf einer Seite mit Entwicklereinstellungen ein
run_diagnosticsTool erstellen, damit ein Agent Korrekturen auslösen kann, die sonst hinter verschachtelten Menüs verborgen sind.
Fehlt Ihr Anwendungsfall? Oder haben Sie eine Idee, die Sie für WebMCP teilen möchten? Nehmen Sie am Early-Access-Programm teil und geben Sie uns Feedback.
Jetzt starten
WebMCP ist als Chrome-Flag für die lokale Entwicklung verfügbar. Es wird in Chrome 149 in einem Ursprungstest verfügbar sein.
So aktivieren Sie WebMCP lokal:
- Öffnen Sie Chrome und rufen Sie
chrome://flags/#enable-webmcp-testingauf. - Setzen Sie das Flag auf Aktiviert.
- Starten Sie Chrome neu, damit die Änderungen wirksam werden.
WebMCP-APIs verwenden
Es gibt zwei APIs, mit denen Sie Ihre Website-Tools einrichten können:
- Imperative API: Definieren Sie verschiedene Arten von Tools mit Standard-JavaScript, z. B. Formulareingabe, Navigationstools, Status verwaltung oder andere Funktionen.
- Deklarative API: Fügen Sie Standard- HTML-Formularen Anmerkungen hinzu, um ein WebMCP-Tool zu erstellen.
Beschränkungen
WebMCP soll komplexe Aufgaben für Agenten und Menschen vereinfachen, es gibt jedoch einige Einschränkungen:
- Browsing-Kontext erforderlich: Da Toolaufrufe in JavaScript verarbeitet werden, muss ein Browsertab oder eine WebView geöffnet sein, um eine sichtbare Oberfläche und einen Browserkontext bereitzustellen. Mit anderen Worten: Es gibt keine Unterstützung für Agenten oder Hilfstools, um Tools im Headless-Modus aufzurufen.
- Mehr Aufwand für komplexe Benutzeroberflächen: Wenn Ihre Website sehr komplex ist, müssen Sie wahrscheinlich JavaScript umgestalten oder hinzufügen, um den Anwendungs- und Benutzeroberflächenstatus zu verwalten.
- Toolerkennung: Clients und Browser müssen eine Website direkt aufrufen, um zu erfahren, ob sie aufrufbare Tools enthält.
Berechtigungsrichtlinie
Beide APIs werden durch die tools Berechtigungsrichtlinie geschützt.
Die Richtlinie ist standardmäßig auf self festgelegt. Dadurch wird die Toolregistrierung in Kontexten der obersten Ebene und desselben Ursprungs ermöglicht und für ursprungsübergreifende iFrames deaktiviert.
Wenn Sie WebMCP-Tools in einem ursprungsübergreifenden iFrame zulassen möchten, fügen Sie dem iFrame das allow="tools"
Attribut hinzu.
Demo
Es sind Demos verfügbar, die sowohl imperative als auch deklarative Implementierungen abdecken:
- WebMCP zaMaker verwendet die imperative WebMCP API.
- Die Reisedemo (React) verwendet die imperative WebMCP API.
- Die Le Petit Bistro-Demo verwendet die deklarative WebMCP API.
Sie können sich den Quellcode der Demo auch auf GitHub ansehen.
Agentenchat mit der Inspector-Erweiterung imitieren
Installieren Sie die Model Context Tool Inspector-Erweiterung um mit einem Agenten zu experimentieren und zu sehen, wie WebMCP-Tools in Live-Demos oder Ihren eigenen Anwendungen funktionieren. Verwenden Sie Prompts in natürlicher Sprache, um zu prüfen, ob der Agent wie erwartet mit WebMCP-Tools interagiert.
Mit der Erweiterung haben Sie folgende Möglichkeiten:
- Überwachen Sie die
navigator.modelContextAPI, um zu sehen, welche Tools auf einer Seite registriert sind. - Tools manuell aufrufen und Funktionen ausführen.
- Prüfen Sie, ob Ihr JSON-Schema richtig definiert ist und der Browser Daten wie vom Tool erwartet parsen kann.
- Strukturierte Ausgaben oder Fehlermeldungen ansehen, die von Ihrem Tool zurückgegeben werden, um sicherzustellen, dass sie klar formuliert und richtig formatiert sind, damit ein Agent sie verstehen kann.
Sprechen Sie mit dem Agenten in natürlicher Sprache, um zu sehen, ob er die entsprechenden WebMCP-Tools korrekt identifizieren und aufrufen kann. Ihre Prompts werden standardmäßig an das Modell gemini-3-flash-preview gesendet.
Mitmachen und Feedback geben
WebMCP wird aktiv diskutiert und kann sich in Zukunft ändern. Wenn Sie diese APIs ausprobieren und Feedback haben, freuen wir uns darauf.
- Lesen Sie die WebMCP-Erläuterung, stellen Sie Fragen und beteiligen Sie sich an der Diskussion.
- Lesen Sie die Best Practices für WebMCP.
- Sehen Sie sich die Implementierung für Chrome unter Chrome Status an.
- Nehmen Sie am Early-Access-Programm teil um einen frühen Einblick in neue APIs zu erhalten und Zugriff auf unsere Mailingliste zu haben.
- Wenn Sie Feedback zur Implementierung von Chrome haben, erstellen Sie in Chromium einen Eintrag für das Problem.