Data publikacji: 18 maja 2026 r.
WebMCP to proponowany standard internetowy, który ułatwia tworzenie i udostępnianie strukturalnych narzędzi dla agentów AI. WebMCP udostępnia JavaScript i dodaje adnotacje do elementów formularza HTML, aby agenty dokładnie wiedziały, jak wchodzić w interakcje z funkcjami strony, co ułatwia użytkownikom korzystanie z witryny. Może to znacznie poprawić wydajność i niezawodność działania agenta.
Agenci AI to nowsza technologia. Mogą one pomagać użytkownikom w wykonywaniu bardzo złożonych i technicznych zadań. WebMCP zapewnia większą dokładność w przypadku wykonywania zadań agentowych i może być dodany jako progresywne ulepszanie.
Dlaczego WebMCP?
WebMCP może pomóc Ci wypełnić lukę między aplikacjami internetowymi a agentami, zwiększając wydajność, niezawodność i skuteczność wykonywania zadań dzięki udostępnianiu reguł interakcji. Zamiast sprawdzać element, np. przycisk lub pole, aby zrozumieć jego przeznaczenie, witryna deklaruje jego cel, dzięki czemu jest on używany prawidłowo.
Jest to bardziej niezawodne niż aktywacja, która może obejmować wiele kroków i pozostawiać każdy z nich otwarty na interpretację przez agenta.
Witryny mogą udostępniać wyraźny cel, np. wyszukiwanie lub zakup, definiując tool. Narzędzia działają w widoczny sposób na stronie, dzięki czemu użytkownicy zyskują pewność, że zadania są wykonywane zgodnie z oczekiwaniami. Dzięki temu zachowasz spójność marki i wybory projektowe oparte na potrzebach użytkowników.
WebMCP obsługuje:
- Discovery: standardowy sposób rejestrowania narzędzi na stronach u agentów, np.
checkoutlubfilter_results. - Schematy JSON: dokładne definicje danych wejściowych i oczekiwanych danych wyjściowych, które ograniczają halucynacje i nieporozumienia.
- Stan: wspólne zrozumienie kontekstu bieżącej strony, dzięki czemu agent wie, jakie zasoby są dostępne do działania w czasie rzeczywistym.
Naszym celem jest tworzenie interfejsów API, które może wdrożyć każdy browser z funkcjami agenta i z których może korzystać, aby użytkownicy mogli łatwiej wykonywać zadania. Możesz śledzić ten proces na stronie GitHub.
Przypadki użycia
WebMCP można używać w internecie na wiele sposobów. Na przykład:
- Pomóż klientom uzyskać pomoc Jeśli udostępniasz klientom oprogramowanie, możesz mieć złożony proces obsługi, który pozwala odpowiadać na wiele różnych pytań. Możesz użyć WebMCP, aby pomóc pracownikowi obsługi klienta szybciej przejść do odpowiedniego formularza i wypełnić pola informacjami podanymi przez użytkownika.
- Ulepszanie rezerwacji podróży. Pomagaj agentom rezerwować złożone podróże obejmujące lot obejmujący wiele miast i wielu pasażerów w mniejszej liczbie kroków.
Niektóre działania mogą być poufne, np. dokonywanie zakupów. Możesz dodać polecenie, które spowoduje wyświetlenie okna potwierdzenia i poprosi użytkownika o interakcję.
W praktyce narzędzia mogą wykonywać te zadania:
- Wypełnianie formularzy strukturalnych: utwórz narzędzie
submit_application, które pomoże agentom prawidłowo mapować dane zebrane podczas rozmowy z użytkownikiem na pola formularza. Możesz na przykład określić, czy pole wymaga podania pełnego imienia i nazwiska, czy osobno imienia i nazwiska. - Interakcje z pracownikami zespołu pomocy w interfejsach przeznaczonych dla ludzi: niektóre pola są przeznaczone dla użytkowników, ale mogą być niezrozumiałe dla agentów. Możesz utworzyć
date_picknarzędzie, które umożliwia złożony wybór daty i godziny w rezerwacji lub przy rezerwowaniu wydarzenia. - Szybsze debugowanie aplikacji: na stronie ustawień dewelopera możesz utworzyć narzędzie
run_diagnostics, dzięki któremu agent będzie mógł uruchamiać poprawki, które w inny sposób są ukryte w zagnieżdżonych menu.
Nie widzisz swojego przypadku użycia? A może masz pomysł, którym chcesz się podzielić w związku z WebMCP? Dołącz do programu wczesnego dostępu i podziel się opinią.
Rozpocznij
WebMCP jest dostępny jako flaga Chrome do programowania lokalnego. Będzie ona dostępna w ramach wersji próbnej origin w Chrome 149.
Aby włączyć WebMCP lokalnie:
- Otwórz Chrome i przejdź do
chrome://flags/#enable-webmcp-testing. - Ustaw flagę na Włączono.
- Aby zastosować zmiany, uruchom ponownie Chrome.
Korzystanie z interfejsów WebMCP API
Do konfigurowania narzędzi w witrynie możesz używać 2 interfejsów API:
- Interfejs API w trybie imperatywnym: definiuj różne typy narzędzi za pomocą standardowego JavaScriptu, np. dane wejściowe formularza, narzędzia do nawigacji, zarządzanie stanem lub inne funkcje.
- Deklaratywny interfejs API: dodaj adnotacje do standardowych formularzy HTML, aby utworzyć narzędzie WebMCP.
Ograniczenia
WebMCP ma na celu ułatwienie agentom i użytkownikom wykonywania złożonych zadań, ale ma pewne ograniczenia:
- Wymagany kontekst przeglądania: wywołania narzędzi są obsługiwane w JavaScript, więc musi być otwarta karta przeglądarki lub widok internetowy, aby zapewnić widoczny interfejs i kontekst przeglądarki. Inaczej mówiąc, nie ma obsługi agentów ani narzędzi wspomagających, które mogłyby wywoływać narzędzia w stanie bez interfejsu.
- Większe obciążenie w przypadku złożonych interfejsów: jeśli Twoja witryna jest bardzo złożona, prawdopodobnie musisz przeprowadzić refaktoryzację lub dodać kod JavaScript, aby obsługiwać stan aplikacji i interfejsu.
- Wykrywalność narzędzi: klienty i przeglądarki muszą odwiedzić witrynę bezpośrednio, aby dowiedzieć się, czy ma ona narzędzia, które można wywołać.
Zasady dotyczące uprawnień
Dostęp do obu interfejsów API jest ograniczony przez tools zasady dotyczące uprawnień.
Domyślna wartość zasady to self, która umożliwia rejestrację narzędzi w kontekstach najwyższego poziomu i kontekstach tego samego pochodzenia, a wyłącza ją w przypadku elementów iframe z innych źródeł.
Aby zezwolić narzędziom WebMCP w międzyźródłowym elemencie iframe, dodaj do niego atrybut allow="tools".
Prezentacja
Przykłady wersji demonstracyjnych obejmujące implementacje imperatywne i deklaratywne są dostępne tutaj:
- WebMCP zaMaker korzysta z interfejsu WebMCP Imperative API.
- Wersja demonstracyjna dotycząca podróży (React) korzysta z interfejsu WebMCP Imperative API.
- Wersja demonstracyjna Le Petit Bistro korzysta z deklaratywnego interfejsu WebMCP API.
Możesz też przejrzeć i zbadać kod źródłowy wersji demonstracyjnej na GitHub.
Symulowanie czatu z pracownikiem obsługi klienta za pomocą rozszerzenia Inspektora
Zainstaluj rozszerzenie Model Context Tool Inspector, aby eksperymentować z agentem i sprawdzać, jak działają narzędzia WebMCP w wersjach demonstracyjnych na żywo lub w Twoich aplikacjach. Używaj promptów w języku naturalnym, aby sprawdzić, czy agent wchodzi w interakcję z narzędziami WebMCP zgodnie z oczekiwaniami.
Dzięki rozszerzeniu możesz:
- Sprawdzaj, które narzędzia są zarejestrowane na stronie, monitorując
navigator.modelContextinterfejs API. - Ręcznie wywołuj narzędzia i wykonuj funkcje.
- Sprawdź, czy schemat JSON jest prawidłowo zdefiniowany i czy przeglądarka może analizować dane zgodnie z oczekiwaniami narzędzia.
- Sprawdź, czy dane wyjściowe lub komunikaty o błędach zwracane przez narzędzie są napisane w jasny sposób i prawidłowo sformatowane, aby pracownik obsługi klienta mógł je zrozumieć.
Porozmawiaj z agentem w języku naturalnym, aby sprawdzić, czy potrafi prawidłowo zidentyfikować i wywołać odpowiednie narzędzia WebMCP. Twoje prompty są domyślnie wysyłane do modelu gemini-3-flash-preview.
Zaangażuj się i prześlij opinię
WebMCP jest obecnie przedmiotem dyskusji i w przyszłości może ulec zmianie. Jeśli wypróbujesz te interfejsy API i chcesz podzielić się opinią, chętnie ją poznamy.
- Przeczytaj wyjaśnienie dotyczące WebMCP, zadawaj pytania i bierz udział w dyskusji.
- Przeczytaj sprawdzone metody korzystania z WebMCP.
- Sprawdź implementację w Chrome na stronie Stan Chrome.
- Dołącz do programu wcześniejszego dostępu, aby jako pierwszy(-a) poznać nowe interfejsy API i uzyskać dostęp do naszej listy mailingowej.
- Jeśli masz uwagi na temat implementacji Chrome, zgłoś błąd w Chromium.