Veröffentlicht am 18. Mai 2026
WebMCP ist ein vorgeschlagener Webstandard, mit dem Sie strukturierte Tools für KI Agenten erstellen und bereitstellen können. WebMCP bietet JavaScript und annotiert HTML-Formularelemente, damit Agenten genau wissen, wie sie mit Seitenfunktionen interagieren müssen, um die Nutzererfahrung zu verbessern. Dadurch können die Leistung und Zuverlässigkeit der Agentenaktivierung erheblich verbessert werden.
KI-Agenten sind eine neuere Technologie. Sie können menschlichen Nutzern helfen, Aufgaben besser zu erledigen, die sehr komplex und technisch sind. WebMCP bietet eine höhere Genauigkeit bei der Erledigung agentischer Aufgaben und kann als Progressive Verbesserung hinzugefügt werden.
Vorteile von WebMCP
WebMCP kann Ihnen helfen, die Lücke zwischen Webanwendungen und Agenten zu schließen und so die Effizienz, Zuverlässigkeit und Aufgabenerledigung zu verbessern, indem es Regeln für die Interaktion bereitstellt. Anstatt dass ein Agent das Element, z. B. eine Schaltfläche oder ein Feld, überprüft, um seinen Zweck zu verstehen, deklariert die Website den Zweck des Elements, damit es richtig verwendet wird.
Das ist zuverlässiger als die Aktivierung, die zahlreiche Schritte umfassen kann und bei der jeder Schritt vom Agenten interpretiert werden muss.
Websites können einen expliziten Zweck wie Suche oder Kauf angeben, indem sie ein Tool definieren. Diese Tools werden auf Ihrer Webseite sichtbar ausgeführt, sodass Nutzer darauf vertrauen können, dass Aufgaben wie erwartet erledigt werden. Außerdem bleiben Ihre Marken- und nutzerorientierten Designentscheidungen erhalten.
WebMCP unterstützt Folgendes:
- Erkennung: Eine Standardmethode für Seiten, um Tools bei Agenten zu registrieren, z. B.
checkoutoderfilter_results. - JSON-Schemas: Explizite Definitionen von Eingaben und erwarteten Ausgaben, um Halluzinationen oder Missverständnisse zu reduzieren.
- Zustand: Ein gemeinsames Verständnis des aktuellen Seitenkontexts, damit der Agent weiß, welche Ressourcen in Echtzeit verfügbar sind.
Unser Ziel ist es, APIs zu entwickeln, die von jedem Browser mit agentischen Funktionen implementiert und genutzt werden können, damit Ihre Nutzer Aufgaben einfacher erledigen können. Sie können diesen Prozess auf GitHubverfolgen.
Anwendungsfälle
Es gibt viele Möglichkeiten, WebMCP im Web zu verwenden. Beispiel:
- Kunden bei der Suche nach Support helfen. Wenn Sie Kunden eine Software anbieten, haben Sie möglicherweise einen komplexen Supportablauf, um viele verschiedene Fragen zu beantworten. Mit WebMCP kann ein Agent schneller zum richtigen Formular navigieren und Felder mit vom Nutzer bereitgestellten Informationen ausfüllen.
- Reisebuchungen verbessern. Helfen Sie Agenten, komplexe Multistop-Flüge und Reisen mit mehreren Passagieren in weniger Schritten zu buchen.
Einige Aktionen können vertraulich sein, z. B. ein Kauf. Sie können einen Befehl einfügen, um eine Nutzerinteraktion mit einem Bestätigungsdialogfeld anzufordern.
In der Praxis können Ihre Tools folgende Aufgaben ausführen:
- Strukturierte Formulare ausfüllen: Erstellen Sie ein
submit_applicationTool, mit dem Agenten Daten, die aus der Unterhaltung mit dem Nutzer erfasst wurden, korrekt Formularfeldern zuordnen können. Sie können beispielsweise unterscheiden, ob in einem Feld ein vollständiger Name oder ein separater Vor- und Nachname erforderlich ist. - Agenteninteraktionen in nutzerorientierten Oberflächen unterstützen: Bestimmte Felder sind
für menschliche Nutzer konzipiert, werden aber möglicherweise nicht von Agenten verstanden. Sie können ein
date_pick-Tool erstellen, mit dem ein komplexes Datum und eine komplexe Uhrzeit für eine Reservierung oder eine Veranstaltungsbuchung ausgewählt werden können. - Anwendungsdebugging beschleunigen: Sie können auf einer Seite mit Entwicklereinstellungen ein
run_diagnosticsTool erstellen, damit ein Agent Korrekturen auslösen kann, die sonst hinter verschachtelten Menüs verborgen sind.
Fehlt Ihr Anwendungsfall? Oder haben Sie eine Idee, die Sie für WebMCP teilen möchten? Nehmen Sie am Early-Access-Programm teil und geben Sie uns Feedback.
Jetzt starten
WebMCP ist als Chrome-Flag für die lokale Entwicklung verfügbar. In Chrome 149 wird es in einem Ursprungstest verfügbar sein.
So aktivieren Sie WebMCP lokal:
- Öffnen Sie Chrome und rufen Sie
chrome://flags/#enable-webmcp-testingauf. - Setzen Sie das Flag auf Aktiviert.
- Starten Sie Chrome neu, damit die Änderungen wirksam werden.
WebMCP-APIs verwenden
Es gibt zwei APIs, mit denen Sie Ihre Website-Tools einrichten können:
- Imperative API: Definieren Sie verschiedene Arten von Tools mit Standard-JavaScript, z. B. Formulareingabe, Navigationstools, Status verwaltung oder andere Funktionen.
- Deklarative API: Fügen Sie Standard- HTML-Formularen Anmerkungen hinzu, um ein WebMCP-Tool zu erstellen.
Beschränkungen
WebMCP soll komplexe Aufgaben für Agenten und Menschen vereinfachen, es gibt jedoch einige Einschränkungen:
- Browsing-Kontext erforderlich: Da Toolaufrufe in JavaScript verarbeitet werden, muss ein Browsertab oder eine WebView geöffnet sein, um eine sichtbare Oberfläche und einen Browserkontext bereitzustellen. Mit anderen Worten: Es gibt keine Unterstützung für Agenten oder Hilfstools, um Tools im Headless-Modus aufzurufen.
- Mehr Aufwand für komplexe Benutzeroberflächen: Wenn Ihre Website sehr komplex ist, müssen Sie wahrscheinlich JavaScript umgestalten oder hinzufügen, um den Anwendungs- und Benutzeroberflächenstatus zu verarbeiten.
- Auffindbarkeit von Tools: Clients und Browser müssen eine Website direkt aufrufen, um zu wissen, ob sie aufrufbare Tools enthält.
Demo
Es sind Beispiele für Demos verfügbar, die sowohl imperative als auch deklarative Implementierungen abdecken:
- WebMCP zaMaker verwendet die WebMCP Imperative API.
- Die Reisedemo (React) verwendet die WebMCP Imperative API.
- Die Le Petit Bistro-Demo verwendet die WebMCP Declarative API.
Sie können sich auch den Quellcode der Demo auf GitHub ansehen.
Agentenchat mit der Inspector-Erweiterung imitieren
Installieren Sie die Model Context Tool Inspector-Erweiterung, um mit einem Agenten zu experimentieren und zu sehen, wie WebMCP-Tools in Live-Demos oder Ihren eigenen Anwendungen funktionieren. Sie können Prompts in natürlicher Sprache eingeben, um zu prüfen, ob ein Agent korrekt mit WebMCP-Tools interagieren kann.
Mit der Erweiterung können Sie Folgendes tun:
- Überwachen Sie die
navigator.modelContextAPI, um zu sehen, welche Tools auf einer Seite registriert sind. - Tools manuell aufrufen und Funktionen ausführen.
- Prüfen Sie, ob Ihr JSON-Schema korrekt definiert ist und ob der Browser Daten wie vom Tool erwartet parsen kann.
- Strukturierte Ausgaben oder Fehlermeldungen ansehen, die von Ihrem Tool zurückgegeben werden, um sicherzustellen, dass sie klar formuliert und korrekt formatiert sind, damit ein Agent sie verstehen kann.
Sprechen Sie mit dem Agenten in natürlicher Sprache, um zu sehen, ob er die entsprechenden WebMCP-Tools korrekt identifizieren und aufrufen kann. Ihre Prompts werden standardmäßig an das Modell gemini-3-flash-preview gesendet.
Mitmachen und Feedback geben
WebMCP wird aktiv diskutiert und kann sich in Zukunft ändern. Wenn Sie diese APIs ausprobieren und Feedback haben, freuen wir uns darauf, von Ihnen zu hören.
- Lesen Sie die WebMCP-Erläuterung, stellen Sie Fragen und beteiligen Sie sich an der Diskussion.
- Lesen Sie die Best Practices für WebMCP.
- Sehen Sie sich die Implementierung für Chrome unter Chrome Status an.
- Nehmen Sie am Early-Access-Programm teil, um einen frühen Einblick in neue APIs zu erhalten und Zugriff auf unsere Mailingliste zu haben.
- Wenn Sie Feedback zur Implementierung von Chrome haben, erstellen Sie in Chromium einen Eintrag für das Problem.