पब्लिश किया गया: 18 मई, 2026
WebMCP वेब के लिए एक ऐसा स्टैंडर्ड है जिसे लागू करने का सुझाव दिया गया है. इसकी मदद से, एआई एजेंट के लिए स्ट्रक्चर्ड टूल बनाए और दिखाए जा सकते हैं. WebMCP, JavaScript उपलब्ध कराता है. साथ ही, एचटीएमएल फ़ॉर्म एलिमेंट पर एनोटेशन जोड़ता है, ताकि एजेंट को यह पता चल सके कि पेज की सुविधाओं के साथ कैसे इंटरैक्ट करना है. इससे उपयोगकर्ता के अनुभव को बेहतर बनाने में मदद मिलती है. इससे, एजेंट के काम करने की परफ़ॉर्मेंस और भरोसेमंद तरीके से काम करने की क्षमता में काफ़ी सुधार हो सकता है.
एआई एजेंट, एक नई टेक्नोलॉजी है. ये उपयोगकर्ताओं को मुश्किल और तकनीकी टास्क बेहतर तरीके से पूरे करने में मदद कर सकते हैं. WebMCP की मदद से, एजेंट के टास्क पूरे करने की सटीक दर बढ़ाई जा सकती है. इसे प्रोग्रेसिव एनहांसमेंट के तौर पर जोड़ा जा सकता है.
WebMCP क्यों इस्तेमाल करें?
WebMCP, वेब ऐप्लिकेशन और एजेंट के बीच के अंतर को कम करने में मदद कर सकता है. साथ ही, इंटरैक्शन के लिए नियम उपलब्ध कराकर, दक्षता, भरोसेमंद तरीके से काम करने की क्षमता, और टास्क पूरे करने की दर को बेहतर बना सकता है. किसी एलिमेंट के मकसद को समझने के लिए, एजेंट को उसकी समीक्षा करने की ज़रूरत नहीं होती. जैसे, बटन या फ़ील्ड. इसके बजाय, वेबसाइट एलिमेंट के मकसद के बारे में बताती है, ताकि उसका सही तरीके से इस्तेमाल किया जा सके
यह एक्चुएशन से ज़्यादा भरोसेमंद है. एक्चुएशन में कई चरण हो सकते हैं और हर चरण को एजेंट के हिसाब से अलग-अलग तरीके से समझा जा सकता है.
वेबसाइटें, टूल तय करके, खोज या खरीदारी जैसे मकसद के बारे में साफ़ तौर पर बता सकती हैं. ये टूल, आपके वेबपेज पर साफ़ तौर पर काम करते हैं. इससे उपयोगकर्ताओं को भरोसा होता है कि टास्क, उम्मीद के मुताबिक पूरे किए जाएंगे. इससे, आपके ब्रैंड और उपयोगकर्ता को ध्यान में रखकर डिज़ाइन किए गए विकल्पों पर कोई असर नहीं पड़ता.
WebMCP इनके साथ काम करता है:
- डिस्कवरी: पेजों के लिए, एजेंट के साथ टूल रजिस्टर करने का एक स्टैंडर्ड तरीका. जैसे,
checkoutयाfilter_results. - JSON स्कीमा: इनपुट और अनुमानित आउटपुट की साफ़ तौर पर दी गई परिभाषाएं, ताकि गलत जानकारी या गलतफ़हमी की संभावना कम हो.
- स्टेट: मौजूदा पेज के कॉन्टेक्स्ट की साझा समझ, ताकि एजेंट को यह पता चल सके कि रीयल टाइम में किन संसाधनों पर कार्रवाई की जा सकती है.
हमारा लक्ष्य ऐसे एपीआई बनाना है जिन्हें एजेंट की सुविधाओं वाला कोई भी ब्राउज़र लागू कर सके और उनसे फ़ायदा पा सके. इससे आपके उपयोगकर्ता, टास्क को आसानी से पूरा कर पाएंगे. GitHub पर, इस प्रोसेस के बारे में जानकारी देखी जा सकती है.
इस्तेमाल के उदाहरण
वेब पर WebMCP का इस्तेमाल कई तरीकों से किया जा सकता है. उदाहरण के लिए:
- अपने ग्राहकों को सहायता उपलब्ध कराएं. अगर ग्राहकों को सॉफ़्टवेयर उपलब्ध कराया जाता है, तो अलग-अलग सवालों के जवाब देने के लिए, सहायता देने की प्रोसेस मुश्किल हो सकती है. WebMCP का इस्तेमाल करके, एजेंट को सही फ़ॉर्म पर तेज़ी से ले जाया जा सकता है. साथ ही, उपयोगकर्ता की दी गई जानकारी के हिसाब से फ़ील्ड भरे जा सकते हैं.
- यात्रा की बुकिंग को बेहतर बनाएं. एजेंट को कम चरणों में, कई शहरों और कई यात्रियों के लिए मुश्किल यात्राएं बुक करने में मदद करें.
कुछ कार्रवाइयां संवेदनशील हो सकती हैं. जैसे, खरीदारी करना. पुष्टि करने वाले डायलॉग के साथ उपयोगकर्ता के इंटरैक्शन का अनुरोध करने के लिए, एक कमांड शामिल की जा सकती है.
असल में, आपके टूल ये टास्क पूरे कर सकते हैं:
- स्ट्रक्चर्ड फ़ॉर्म भरना: एक
submit_applicationटूल बनाएं, ताकि एजेंट, उपयोगकर्ता के साथ बातचीत से इकट्ठा किए गए डेटा को फ़ॉर्म फ़ील्ड में सही तरीके से मैप कर सकें. उदाहरण के लिए, यह अंतर किया जा सकता है कि किसी फ़ील्ड में पूरा नाम ज़रूरी है या पहला और आखिरी नाम अलग-अलग. - उपयोगकर्ता को ध्यान में रखकर डिज़ाइन किए गए इंटरफ़ेस में एजेंट के इंटरैक्शन की सुविधा देना: कुछ फ़ील्ड,
उपयोगकर्ताओं के लिए डिज़ाइन किए जाते हैं, लेकिन एजेंट उन्हें नहीं समझ पाते.
date_pickटूल बनाया जा सकता है. इससे रिज़र्वेशन या इवेंट बुकिंग में, तारीख और समय को अलग-अलग तरीके से चुना जा सकता है. - ऐप्लिकेशन को डीबग करना: डेवलपर सेटिंग वाले पेज पर,
run_diagnosticsटूल बनाया जा सकता है. इससे एजेंट, उन समस्याओं को ठीक कर सकता है जो नेस्ट किए गए मेन्यू में छिपी होती हैं.
क्या आपका इस्तेमाल का उदाहरण मौजूद नहीं है? या क्या आपके पास WebMCP के लिए कोई ऐसा आइडिया है जिसे शेयर करने के लिए आप उत्साहित हैं? अर्ली प्रीव्यू प्रोग्राम में शामिल हों और अपने सुझाव या राय शेयर करें.
शुरू करें
WebMCP, स्थानीय डेवलपमेंट के लिए Chrome फ़्लैग के तौर पर उपलब्ध है. यह Chrome के वर्शन 149 में ऑरिजिन ट्रायल में उपलब्ध होगा.
WebMCP को स्थानीय तौर पर चालू करने के लिए:
- Chrome खोलें और
chrome://flags/#enable-webmcp-testingपर जाएं - फ़्लैग को चालू करें पर सेट करें.
- बदलाव लागू करने के लिए, Chrome को फिर से लॉन्च करें.
WebMCP के एपीआई इस्तेमाल करना
अपनी वेबसाइट के टूल सेट अप करने के लिए, दो एपीआई का इस्तेमाल किया जा सकता है:
- इंपेरेटिव एपीआई: स्टैंडर्ड JavaScript की मदद से, अलग-अलग तरह के टूल तय करें. जैसे, फ़ॉर्म इनपुट, नेविगेशन टूल, स्टेट मैनेजमेंट या अन्य फ़ंक्शन.
- डिक्लेरेटिव एपीआई: WebMCP टूल बनाने के लिए, स्टैंडर्ड एचटीएमएल फ़ॉर्म में एनोटेशन जोड़ें.
सीमाएं
WebMCP का मकसद, एजेंट और उपयोगकर्ताओं के लिए मुश्किल टास्क को आसान बनाना है. हालांकि, इसकी कुछ सीमाएं हैं:
- ब्राउज़िंग कॉन्टेक्स्ट ज़रूरी है: टूल कॉल को JavaScript में हैंडल किया जाता है. इसलिए, दिखने वाला इंटरफ़ेस और ब्राउज़र कॉन्टेक्स्ट उपलब्ध कराने के लिए, ब्राउज़र टैब या वेबव्यू खोला जाना चाहिए. दूसरे शब्दों में कहें, तो एजेंट या ऐक्सेसिबिलिटी टूल के लिए, हेडलेस स्टेट में टूल कॉल करने की सुविधा उपलब्ध नहीं है.
- मुश्किल इंटरफ़ेस के लिए ज़्यादा ओवरहेड: अगर आपकी साइट बहुत मुश्किल है, तो आपको ऐप्लिकेशन और इंटरफ़ेस स्टेट को हैंडल करने के लिए, JavaScript को फिर से फ़ैक्टर करना या जोड़ना पड़ सकता है.
- टूल की खोज: क्लाइंट और ब्राउज़र को सीधे किसी साइट पर जाकर यह देखना होगा कि उसमें कॉल किए जा सकने वाले टूल हैं या नहीं.
डेमो
इंपेरेटिव और डिक्लेरेटिव, दोनों तरह के लागू करने के उदाहरण उपलब्ध हैं:
- WebMCP zaMaker, WebMCP के इंपेरेटिव एपीआई का इस्तेमाल करता है.
- ट्रैवल डेमो (React), WebMCP के इंपेरेटिव एपीआई का इस्तेमाल करता है.
- Le Petit Bistro डेमो, WebMCP के डिक्लेरेटिव एपीआई का इस्तेमाल करता है.
इंस्पेक्टर एक्सटेंशन की मदद से, एजेंट के साथ चैट की नकल करना
एजेंट के साथ एक्सपेरिमेंट करने के लिए, Model Context Tool Inspector Extension इंस्टॉल करें. साथ ही, देखें कि लाइव डेमो या आपके अपने ऐप्लिकेशन में, WebMCP के टूल कैसे काम करते हैं. यह देखने के लिए कि कोई एजेंट, WebMCP के टूल के साथ सही तरीके से इंटरैक्ट कर सकता है या नहीं, नैचुरल लैंग्वेज प्रॉम्प्ट डाले जा सकते हैं.
एक्सटेंशन की मदद से, ये काम किए जा सकते हैं:
navigator.modelContextएपीआई की निगरानी करके, यह देखा जा सकता है कि किसी पेज पर कौनसा टूल रजिस्टर है.- मैन्युअल तरीके से टूल कॉल किए जा सकते हैं और फ़ंक्शन लागू किए जा सकते हैं.
- यह पुष्टि की जा सकती है कि आपका JSON स्कीमा सही तरीके से तय किया गया है और ब्राउज़र, टूल की उम्मीद के मुताबिक डेटा पार्स कर सकता है.
- यह पक्का करने के लिए कि आपके टूल से मिलने वाला स्ट्रक्चर्ड आउटपुट या गड़बड़ी के मैसेज साफ़ तौर पर लिखे गए हैं और सही तरीके से फ़ॉर्मैट किए गए हैं, उन्हें देखा जा सकता है. इससे एजेंट को उन्हें समझने में मदद मिलती है.
नैचुरल लैंग्वेज का इस्तेमाल करके, एजेंट से बात करें. इससे यह देखा जा सकता है कि वह WebMCP के सही टूल की पहचान कर सकता है और उन्हें लागू कर सकता है या नहीं. आपके प्रॉम्प्ट, डिफ़ॉल्ट रूप से gemini-3-flash-preview मॉडल को भेजे जाते हैं.
सुझाव या राय देना और बातचीत में शामिल होना
WebMCP पर फ़िलहाल चर्चा चल रही है. आने वाले समय में, इसमें बदलाव हो सकता है. अगर आपने इन एपीआई को आज़माया है और आपके पास कोई सुझाव या राय है, तो हमें इसके बारे में बताएं.
- WebMCP के बारे में जानकारी देने वाला लेख पढ़ें, सवाल पूछें, और चर्चा में शामिल हों.
- WebMCP के सबसे सही तरीके पढ़ें.
- Chrome Status पर, Chrome के लिए लागू करने की प्रोसेस की समीक्षा करें.
- नए एपीआई को सबसे पहले देखने और हमारी मेलिंग सूची का ऐक्सेस पाने के लिए, अर्ली प्रीव्यू प्रोग्राम में शामिल हों.
- अगर आपके पास Chrome के लागू करने की प्रोसेस के बारे में कोई सुझाव या राय है, तो Chromium में गड़बड़ी की शिकायत करें.