WebMCP

Alexandra Klepper
Alexandra Klepper

Opublikowano: 18 maja 2026 r.

WebMCP to proponowany standard internetowy, który ułatwia tworzenie i udostępnianie uporządkowanych narzędzi dla agentów AI AI. WebMCP udostępnia JavaScript i dodaje adnotacje do elementów formularza HTML, dzięki czemu agenci dokładnie wiedzą, jak wchodzić w interakcje z funkcjami strony, aby poprawić komfort użytkownika. Może to znacznie zwiększyć wydajność i niezawodność działania agenta.

Agenci AI to nowa technologia. Mogą oni pomagać użytkownikom w wykonywaniu złożonych i technicznych zadań. WebMCP zapewnia większą dokładność wykonywania zadań przez agenta i można go dodać jako progresywne ulepszenie.

Dlaczego WebMCP?

WebMCP może pomóc Ci w połączeniu aplikacji internetowych i agentów, zwiększając wydajność, niezawodność i skuteczność wykonywania zadań dzięki udostępnieniu reguł interakcji. Zamiast analizować element, taki jak przycisk lub pole, aby zrozumieć jego przeznaczenie, witryna deklaruje jego przeznaczenie, dzięki czemu jest on używany prawidłowo.

Jest to bardziej niezawodne niż działanie, które może obejmować wiele kroków, a każdy z nich może być interpretowany przez agenta na różne sposoby.

Witryny mogą udostępniać wyraźne przeznaczenie, np. wyszukiwanie lub zakupy, przez zdefiniowanie narzędzia. Te narzędzia działają na Twojej stronie w widoczny sposób, dzięki czemu użytkownicy mają pewność, że zadania są wykonywane zgodnie z oczekiwaniami. Pozwala to też zachować spójność marki i projektowania zorientowanego na użytkownika.

WebMCP obsługuje:

  • Wykrywanie: standardowy sposób rejestrowania narzędzi przez strony u agentów, np. checkout lub filter_results.
  • Schematy JSON: wyraźne definicje danych wejściowych i oczekiwanych danych wyjściowych, które zmniejszają ryzyko halucynacji lub nieporozumień.
  • Stan: wspólne rozumienie bieżącego kontekstu strony, dzięki czemu agent wie, jakie zasoby są dostępne do działania w czasie rzeczywistym.

Naszym celem jest tworzenie interfejsów API, które mogą być implementowane przez dowolną przeglądarkę z funkcjami agenta i z których mogą korzystać użytkownicy, aby łatwiej wykonywać zadania. Możesz śledzić ten proces na GitHub.

Przypadki użycia

WebMCP można wykorzystać w internecie na wiele sposobów. Na przykład:

  • Pomaganie klientom w uzyskaniu pomocy. Jeśli udostępniasz klientom oprogramowanie, możesz mieć złożony proces pomocy, który odpowiada na wiele różnych pytań. Za pomocą WebMCP możesz pomóc agentowi szybciej przejść do odpowiedniego formularza i wypełnić pola informacjami podanymi przez użytkownika.
  • Usprawnianie rezerwacji podróży. Pomóż agentom rezerwować złożone podróże obejmujące wiele miast i wielu pasażerów w mniejszej liczbie kroków.

Niektóre działania mogą być wrażliwe, np. dokonanie zakupu. Możesz dodać polecenie, aby poprosić użytkownika o interakcję z oknem potwierdzenia.

W praktyce Twoje narzędzia mogą wykonywać te zadania:

  • Wypełnianie formularzy strukturalnych: utwórz narzędzie submit_application, które pomoże agentom prawidłowo mapować dane zebrane podczas rozmowy z użytkownikiem na pola formularza. Możesz na przykład rozróżnić, czy pole wymaga pełnej nazwy, czy osobno imienia i nazwiska.
  • Obsługa interakcji agenta w interfejsach zorientowanych na użytkownika: niektóre pola są przeznaczone dla użytkowników, ale mogą nie być zrozumiałe dla agentów. Możesz utworzyć narzędzie date_pick, które umożliwia złożony wybór daty i godziny w rezerwacji lub rezerwacji wydarzenia.
  • Szybsze debugowanie aplikacji: na stronie ustawień dewelopera możesz utworzyć narzędzie run_diagnostics, dzięki czemu agent może wywoływać poprawki, które w przeciwnym razie byłyby ukryte w zagnieżdżonych menu.

Brakuje Twojego przypadku użycia? A może masz pomysł, którym chcesz się podzielić w związku z WebMCP? Dołącz do programu wcześniejszego dostępu i prześlij opinię.

Rozpocznij

WebMCP jest dostępny jako flaga Chrome na potrzeby lokalnego tworzenia. Będzie dostępny w ramach wersji próbnej origin w Chrome 149.

Aby włączyć WebMCP lokalnie:

  1. Otwórz Chrome i przejdź do chrome://flags/#enable-webmcp-testing.
  2. Ustaw flagę na Włączone.
  3. Uruchom ponownie Chrome, aby zastosować zmiany.

Korzystanie z interfejsów WebMCP API

Do skonfigurowania narzędzi witryny możesz użyć 2 interfejsów API:

  • Imperatywny interfejs API: definiuj różne typy narzędzi za pomocą standardowego JavaScriptu, np. wprowadzanie danych w formularzu, narzędzia nawigacyjne, zarządzanie stanem lub inne funkcje.
  • Deklaratywny interfejs API: dodaj adnotacje do standardowych formularzy HTML, aby utworzyć narzędzie WebMCP.

Ograniczenia

Chociaż WebMCP ma na celu uproszczenie złożonych zadań dla agentów i ludzi, istnieją pewne ograniczenia:

  • Wymagany kontekst przeglądania: ponieważ wywołania narzędzi są obsługiwane w JavaScript, musi być otwarta karta przeglądarki lub widok internetowy, aby zapewnić widoczny interfejs i kontekst przeglądarki. Innymi słowy, nie ma obsługi agentów ani narzędzi wspomagających, które wywołują narzędzia w stanie bez interfejsu graficznego.
  • Większy narzut w przypadku złożonych interfejsów: jeśli Twoja witryna jest bardzo złożona, prawdopodobnie musisz przeprowadzić refaktoryzację lub dodać JavaScript, aby obsługiwać stan aplikacji i interfejsu.
  • Wykrywalność narzędzi: aby dowiedzieć się, czy witryna ma narzędzia, które można wywołać, klienci i przeglądarki muszą odwiedzić ją bezpośrednio.

Prezentacja

Dostępne są przykłady prezentacji obejmujące implementacje imperatywne i deklaratywne:

Możesz też przejrzeć i zbadać kod źródłowy prezentacji na GitHub.

Imitowanie czatu agenta za pomocą rozszerzenia inspektora

Zainstaluj rozszerzenie Model Context Tool Inspector Extension, aby eksperymentować z agentem i zobaczyć, jak działają narzędzia WebMCP w prezentacjach na żywo lub w Twoich aplikacjach. Możesz wpisywać prompty w języku naturalnym, aby sprawdzić, czy agent może prawidłowo wchodzić w interakcje z narzędziami WebMCP.

Dzięki rozszerzeniu możesz:

  • Sprawdzić, które narzędzia są zarejestrowane na stronie, monitorując interfejs navigator.modelContext API.
  • Ręcznie wywoływać narzędzia i wykonywać funkcje.
  • Sprawdzić, czy schemat JSON jest prawidłowo zdefiniowany i czy przeglądarka może analizować dane zgodnie z oczekiwaniami narzędzia.
  • Wyświetlać uporządkowane dane wyjściowe lub komunikaty o błędach zwracane przez narzędzie, aby upewnić się, że są one napisane jasno i prawidłowo sformatowane, dzięki czemu agent może je zrozumieć.

Rozmawiaj z agentem w języku naturalnym, aby sprawdzić, czy może on prawidłowo identyfikować i wywoływać odpowiednie narzędzia WebMCP. Domyślnie prompty są wysyłane do modelu gemini-3-flash-preview.

Zaangażuj się i prześlij opinię

WebMCP jest obecnie omawiany i w przyszłości może ulec zmianie. Jeśli wypróbujesz te interfejsy API i masz jakieś uwagi, chętnie je poznamy.