Opublikowano: 18 maja 2026 r.
WebMCP to proponowany standard internetowy, który ułatwia tworzenie i udostępnianie uporządkowanych narzędzi dla agentów AI AI. WebMCP udostępnia JavaScript i dodaje adnotacje do elementów formularza HTML, dzięki czemu agenci dokładnie wiedzą, jak wchodzić w interakcje z funkcjami strony, aby zapewnić użytkownikom jak najlepsze wrażenia. Może to znacznie zwiększyć wydajność i niezawodność działania agenta.
Agenci AI to nowa technologia. Mogą oni pomagać użytkownikom w wykonywaniu złożonych i technicznych zadań. WebMCP zapewnia większą dokładność wykonywania zadań przez agenta i można go dodać jako progresywne ulepszenie.
Dlaczego WebMCP?
WebMCP może pomóc Ci w połączeniu aplikacji internetowych z agentami, zwiększając wydajność, niezawodność i skuteczność wykonywania zadań dzięki udostępnieniu reguł interakcji. Zamiast analizować element, taki jak przycisk lub pole, aby zrozumieć jego przeznaczenie, witryna deklaruje jego przeznaczenie, dzięki czemu jest on używany prawidłowo.
Jest to bardziej niezawodne niż działanie, które może obejmować wiele kroków i pozostawiać każdy z nich do interpretacji przez agenta.
Witryny mogą udostępniać wyraźne przeznaczenie, np. wyszukiwanie lub zakupy, przez zdefiniowanie narzędzia. Narzędzia te działają na stronie w widoczny sposób, dzięki czemu użytkownicy mają pewność, że zadania są wykonywane zgodnie z oczekiwaniami. Pozwala to też zachować spójność marki i projektowania zorientowanego na użytkownika.
WebMCP obsługuje:
- Wykrywanie: standardowy sposób rejestrowania narzędzi przez strony u agentów, np.
checkoutlubfilter_results. - Schematy JSON: wyraźne definicje danych wejściowych i oczekiwanych danych wyjściowych, które zmniejszają ryzyko halucynacji lub nieporozumień.
- Stan: wspólne rozumienie bieżącego kontekstu strony, dzięki czemu agent wie, jakie zasoby są dostępne do działania w czasie rzeczywistym.
Naszym celem jest tworzenie interfejsów API, które mogą być implementowane przez dowolną przeglądarkę z funkcjami agenta i z których mogą korzystać użytkownicy, aby łatwiej wykonywać zadania. Możesz śledzić ten proces na GitHub.
Przypadki użycia
WebMCP można używać w internecie na wiele sposobów. Na przykład:
- Pomaganie klientom w uzyskaniu pomocy. Jeśli udostępniasz klientom oprogramowanie, możesz mieć złożony proces pomocy, który odpowiada na wiele różnych pytań. Za pomocą WebMCP możesz pomóc agentowi szybciej przejść do odpowiedniego formularza i wypełnić pola informacjami podanymi przez użytkownika.
- Usprawnianie rezerwacji podróży. Pomóż agentom rezerwować złożone podróże obejmujące wiele miast i wielu pasażerów w mniejszej liczbie kroków.
Niektóre działania mogą być wrażliwe, np. dokonanie zakupu. Możesz dodać polecenie, aby poprosić użytkownika o interakcję z oknem potwierdzenia.
W praktyce Twoje narzędzia mogą wykonywać te zadania:
- Wypełnianie formularzy strukturalnych: utwórz narzędzie
submit_application, które pomoże agentom prawidłowo mapować dane zebrane podczas rozmowy z użytkownikiem na pola formularza. Możesz na przykład rozróżnić, czy pole wymaga pełnej nazwy, czy osobno imienia i nazwiska. - Obsługa interakcji agenta w interfejsach zorientowanych na użytkownika: niektóre pola są
przeznaczone dla użytkowników, ale mogą nie być zrozumiałe dla agentów. Możesz utworzyć narzędzie
date_pick, które umożliwia złożony wybór daty i godziny w rezerwacji lub rezerwacji wydarzenia. - Szybsze debugowanie aplikacji: na stronie ustawień dewelopera możesz utworzyć narzędzie
run_diagnostics, dzięki czemu agent może wywoływać poprawki, które w przeciwnym razie byłyby ukryte za zagnieżdżonymi menu.
Czy brakuje Twojego przypadku użycia? A może masz pomysł, którym chcesz się podzielić w związku z WebMCP? Dołącz do programu wcześniejszego dostępu i prześlij opinię.
Rozpocznij
WebMCP jest dostępny jako flaga Chrome do lokalnego tworzenia. Będzie dostępny w wersji próbnej origin w Chrome 149.
Aby włączyć WebMCP lokalnie:
- Otwórz Chrome i przejdź do
chrome://flags/#enable-webmcp-testing. - Ustaw flagę na Włączone.
- Uruchom ponownie Chrome, aby zastosować zmiany.
Korzystanie z interfejsów WebMCP API
Do konfigurowania narzędzi witryny możesz używać 2 interfejsów API:
- Imperatywny interfejs API: definiuj różne typy narzędzi za pomocą standardowego JavaScriptu, np. narzędzia do wprowadzania danych w formularzu, narzędzia do nawigacji, zarządzania stanem lub inne funkcje.
- Deklaratywny interfejs API: dodaj adnotacje do standardowych formularzy HTML, aby utworzyć narzędzie WebMCP.
Ograniczenia
Chociaż WebMCP ma na celu uproszczenie złożonych zadań dla agentów i ludzi, ma pewne ograniczenia:
- Wymagany kontekst przeglądania: ponieważ wywołania narzędzi są obsługiwane w JavaScript, musi być otwarta karta przeglądarki lub widok internetowy, aby zapewnić widoczny interfejs i kontekst przeglądarki. Innymi słowy, nie ma obsługi agentów ani narzędzi wspomagających, które wywołują narzędzia w stanie bez interfejsu graficznego.
- Większy narzut w przypadku złożonych interfejsów: jeśli Twoja witryna jest bardzo złożona, prawdopodobnie musisz przeprowadzić refaktoryzację lub dodać JavaScript, aby obsługiwać stan aplikacji i interfejsu.
- Wykrywalność narzędzi: aby sprawdzić, czy witryna ma narzędzia, które można wywołać, klienci i przeglądarki muszą odwiedzić ją bezpośrednio.
Prezentacja
Dostępne są przykłady prezentacji obejmujące implementacje imperatywne i deklaratywne:
- WebMCP zaMaker korzysta z imperatywnego interfejsu WebMCP API.
- Prezentacja podróży (React) korzysta z imperatywnego interfejsu WebMCP API.
- Prezentacja Le Petit Bistro korzysta z deklaratywnego interfejsu WebMCP API.
Możesz też przejrzeć i zbadać kod źródłowy prezentacji na GitHub.
Imitowanie czatu agenta za pomocą rozszerzenia inspektora
Zainstaluj rozszerzenie Model Context Tool Inspector, aby eksperymentować z agentem i zobaczyć, jak działają narzędzia WebMCP w prezentacjach na żywo lub w Twoich aplikacjach. Możesz wpisywać prompty w języku naturalnym, aby sprawdzić, czy agent może prawidłowo wchodzić w interakcje z narzędziami WebMCP.
Dzięki rozszerzeniu możesz:
- sprawdzić, które narzędzia są zarejestrowane na stronie, monitorując interfejs
navigator.modelContextAPI; - ręcznie wywoływać narzędzia i wykonywać funkcje;
- sprawdzić, czy schemat JSON jest prawidłowo zdefiniowany i czy przeglądarka może analizować dane zgodnie z oczekiwaniami narzędzia;
- wyświetlać uporządkowane dane wyjściowe lub komunikaty o błędach zwracane przez narzędzie, aby upewnić się, że są one napisane jasno i prawidłowo sformatowane, dzięki czemu agent może je zrozumieć.
Rozmawiaj z agentem w języku naturalnym, aby sprawdzić, czy może on prawidłowo identyfikować i wywoływać odpowiednie narzędzia WebMCP. Twoje prompty są wysyłane do modelu gemini-2.5-flash.
Zaangażuj się i prześlij opinię
WebMCP jest obecnie przedmiotem dyskusji i w przyszłości może ulec zmianie. Jeśli wypróbujesz te interfejsy API i masz jakieś uwagi, chętnie je poznamy.
- Przeczytaj wyjaśnienie WebMCP, zadawaj pytania i bierz udział w dyskusji.
- Przeczytaj sprawdzone metody WebMCP.
- Sprawdź implementację Chrome w Chrome Status.
- Dołącz do programu wcześniejszego dostępu, aby wcześniej poznać nowe interfejsy API i uzyskać dostęp do naszej listy mailingowej.
- Jeśli masz uwagi na temat implementacji Chrome, zgłoś błąd w Chromium.