पब्लिश होने की तारीख: 18 मई, 2026, पिछली बार अपडेट होने की तारीख: 5 जून, 2026
WebMCP एक प्रस्तावित वेब स्टैंडर्ड है. इससे आपको एआई एजेंट के लिए स्ट्रक्चर्ड टूल बनाने और उन्हें उपलब्ध कराने में मदद मिलती है. WebMCP, JavaScript उपलब्ध कराता है और एचटीएमएल फ़ॉर्म एलिमेंट को एनोटेट करता है. इससे एजेंट को यह पता चलता है कि पेज की सुविधाओं के साथ कैसे इंटरैक्ट करना है, ताकि उपयोगकर्ता को बेहतर अनुभव मिल सके. इससे एजेंट ऐक्टिवेशन की परफ़ॉर्मेंस और भरोसेमंद होने की क्षमता में काफ़ी सुधार हो सकता है.
एआई एजेंट, नई टेक्नोलॉजी हैं. ये इंसानों को ऐसे मुश्किल और तकनीकी काम बेहतर तरीके से पूरे करने में मदद कर सकते हैं. WebMCP, एजेंट की मदद से टास्क पूरा करने के लिए ज़्यादा सटीक नतीजे देता है. इसे प्रोग्रेसिव एन्हांसमेंट के तौर पर जोड़ा जा सकता है.
WebMCP का इस्तेमाल क्यों करें?
WebMCP, वेब ऐप्लिकेशन और एजेंट के बीच के अंतर को कम करने में आपकी मदद कर सकता है. साथ ही, इंटरैक्शन के लिए नियम तय करके, दक्षता, भरोसेमंद होने, और टास्क पूरा करने की क्षमता को बेहतर बना सकता है. बटन या फ़ील्ड जैसे एलिमेंट की समीक्षा करने के लिए एजेंट की ज़रूरत नहीं होती. वेबसाइट, एलिमेंट के मकसद के बारे में बताती है, ताकि उसका सही तरीके से इस्तेमाल किया जा सके
यह ऐक्चुएशन से ज़्यादा भरोसेमंद है. ऐक्चुएशन में कई चरण हो सकते हैं और हर चरण को एजेंट के हिसाब से तय किया जाता है.
वेबसाइटें, tool को तय करके, खोज या खरीदारी जैसे मकसद के बारे में साफ़ तौर पर बता सकती हैं. टूल, आपके वेबपेज पर साफ़ तौर पर काम करते हैं. इसलिए, उपयोगकर्ताओं को भरोसा होता है कि टास्क उनकी उम्मीद के मुताबिक पूरे किए जा रहे हैं. इससे आपके ब्रैंड और लोगों की ज़रूरतों को ध्यान में रखकर किए गए डिज़ाइन के विकल्पों को भी सुरक्षित रखा जा सकता है.
WebMCP इनके साथ काम करता है:
- डिस्कवरी: पेजों के लिए, एजेंट के साथ टूल रजिस्टर करने का स्टैंडर्ड तरीका. जैसे,
checkoutयाfilter_results. - JSON स्कीमा: इसमें इनपुट और अनुमानित आउटपुट की साफ़ तौर पर जानकारी दी जाती है, ताकि एआई के जवाब में तथ्यों के ग़लत होने या गलतफ़हमी होने की संभावना कम हो.
- स्टेट: इससे एजेंट को मौजूदा पेज के कॉन्टेक्स्ट के बारे में जानकारी मिलती है. इससे एजेंट को पता चलता है कि रीयल टाइम में कार्रवाई करने के लिए, कौनसे संसाधन उपलब्ध हैं.
हमारा लक्ष्य ऐसे एपीआई बनाना है जिन्हें एजेंटिक एआई की सुविधाओं वाले किसी भी ब्राउज़र में लागू किया जा सके और उनसे फ़ायदा पाया जा सके. इससे आपके उपयोगकर्ताओं को टास्क पूरा करने में आसानी होगी. इस प्रोसेस को GitHub पर फ़ॉलो किया जा सकता है.
उपयोग के उदाहरण
वेब पर WebMCP का इस्तेमाल कई तरीकों से किया जा सकता है. उदाहरण के लिए:
- अपने ग्राहकों को सहायता पाने में मदद करें. अगर आपने ग्राहकों को कोई सॉफ़्टवेयर उपलब्ध कराया है, तो हो सकता है कि आपको अलग-अलग सवालों के जवाब देने के लिए, सहायता से जुड़ी जटिल प्रोसेस अपनानी पड़े. WebMCP का इस्तेमाल करके, एजेंट को सही फ़ॉर्म पर तेज़ी से जाने और उपयोगकर्ता की दी गई जानकारी के साथ फ़ील्ड भरने में मदद की जा सकती है.
- यात्रा की बुकिंग को बेहतर बनाना. एजेंट को कम चरणों में, मुश्किल, एक से ज़्यादा शहरों की यात्रा, और एक से ज़्यादा यात्रियों की यात्रा बुक करने में मदद करें.
कुछ कार्रवाइयां संवेदनशील हो सकती हैं. जैसे, खरीदारी करना. पुष्टि करने वाले डायलॉग के साथ उपयोगकर्ता के इंटरैक्शन का अनुरोध करने के लिए, एक कमांड शामिल की जा सकती है.
आपके टूल, ये काम कर सकते हैं:
- स्ट्रक्चर्ड फ़ॉर्म भरना: एक
submit_applicationटूल बनाएं. इससे एजेंट को, उपयोगकर्ता के साथ हुई बातचीत से इकट्ठा किए गए डेटा को फ़ॉर्म फ़ील्ड में सही तरीके से मैप करने में मदद मिलेगी. उदाहरण के लिए, यह तय किया जा सकता है कि किसी फ़ील्ड में पूरा नाम डालना ज़रूरी है या पहला और आखिरी नाम अलग-अलग डालना है. - ऐसे इंटरफ़ेस में सहायता एजेंट के साथ इंटरैक्ट करना जो इंसानों के लिए बनाए गए हैं: कुछ फ़ील्ड इंसानों के लिए डिज़ाइन किए गए हैं, लेकिन हो सकता है कि एजेंट उन्हें न समझ पाएं. आपके पास
date_pickटूल बनाने का विकल्प है. इसकी मदद से, बुकिंग या इवेंट की बुकिंग में तारीख और समय को आसानी से चुना जा सकता है. - ऐप्लिकेशन को तेज़ी से डीबग करना: डेवलपर सेटिंग वाले पेज पर
run_diagnosticsटूल बनाया जा सकता है. इससे एजेंट, उन फ़िक्स को ट्रिगर कर सकता है जो नेस्ट किए गए मेन्यू में छिपे होते हैं.
क्या आपको इस्तेमाल का कोई ऐसा उदाहरण नहीं मिला जो आपकी ज़रूरत के मुताबिक हो? या क्या आपके पास WebMCP के लिए कोई ऐसा आइडिया है जिसे शेयर करने के लिए आप उत्साहित हैं? अर्ली प्रीव्यू प्रोग्राम में शामिल हों और अपने सुझाव/राय दें या शिकायत करें.
अपनी प्रोफ़ाइल बनाना शुरू करें
WebMCP, लोकल डेवलपमेंट के लिए Chrome फ़्लैग के तौर पर उपलब्ध है. यह Chrome 149 में ऑरिजिन ट्रायल के तौर पर उपलब्ध होगा.
WebMCP को स्थानीय तौर पर चालू करने के लिए:
- Chrome खोलें और
chrome://flags/#enable-webmcp-testingपर जाएं - फ़्लैग को चालू है पर सेट करें.
- बदलाव लागू करने के लिए, Chrome को फिर से लॉन्च करें.
WebMCP API का इस्तेमाल करना
वेबसाइट के टूल सेट अप करने के लिए, इन दो एपीआई का इस्तेमाल किया जा सकता है:
- इंपरेटिव एपीआई: स्टैंडर्ड JavaScript की मदद से, अलग-अलग तरह के टूल तय करें. जैसे, फ़ॉर्म इनपुट, नेविगेशन टूल, स्टेट मैनेजमेंट या अन्य फ़ंक्शन.
- डिक्लेरेटिव एपीआई: WebMCP टूल बनाने के लिए, स्टैंडर्ड एचटीएमएल फ़ॉर्म में एनोटेशन जोड़ें.
सीमाएं
WebMCP का मकसद, एजेंट और लोगों के लिए मुश्किल टास्क को आसान बनाना है. हालांकि, इसकी कुछ सीमाएं हैं:
- ब्राउज़िंग कॉन्टेक्स्ट ज़रूरी है: टूल कॉल को JavaScript में हैंडल किया जाता है. इसलिए, ब्राउज़र टैब या वेबव्यू को खोलना ज़रूरी है, ताकि दिखने वाला इंटरफ़ेस और ब्राउज़र कॉन्टेक्स्ट उपलब्ध कराया जा सके. दूसरे शब्दों में कहें, तो हेडलेस मोड में कॉल करने वाले टूल के लिए, एजेंट या सहायता करने वाले टूल काम नहीं करते.
- जटिल इंटरफ़ेस के लिए ज़्यादा ओवरहेड: अगर आपकी साइट बहुत जटिल है, तो आपको ऐप्लिकेशन और इंटरफ़ेस की स्थिति को मैनेज करने के लिए, JavaScript को फिर से फ़ैक्टर करना होगा या उसे जोड़ना होगा.
- टूल का पता लगाना: क्लाइंट और ब्राउज़र को सीधे तौर पर किसी साइट पर जाना होगा, ताकि यह पता चल सके कि उसमें कॉल किए जा सकने वाले टूल हैं या नहीं.
सुरक्षा और अनुमतियां
WebMCP एपीआई, ऑरिजिन आइसोलेशन की ज़रूरी शर्तों और अनुमतियों से जुड़ी नीति, दोनों के तहत आते हैं.
ऑरिजिन आइसोलेशन
WebMCP, सिर्फ़ ऑरिजिन-आइसोलेटेड दस्तावेज़ों में उपलब्ध है. इससे यह पक्का होता है कि टूल के इस्तेमाल के दौरान, दस्तावेज़ का ओरिजनल सोर्स एक जैसा रहे.
अगर किसी दस्तावेज़ के लिए document.domain चालू है (उदाहरण के लिए, Origin-Agent-Cluster: ?0 एचटीटीपी हेडर का इस्तेमाल करके), तो WebMCP API बंद हो जाते हैं.
अनुमतियों की नीति
दोनों एपीआई, tools अनुमतियों से जुड़ी नीति के तहत आते हैं.
नीति डिफ़ॉल्ट रूप से self पर सेट होती है. इससे टॉप-लेवल और एक ही ऑरिजिन वाले कॉन्टेक्स्ट में टूल रजिस्टर करने की अनुमति मिलती है. साथ ही, क्रॉस-ऑरिजिन iframe के लिए इसे बंद कर दिया जाता है.
क्रॉस-ऑरिजिन iframe में WebMCP टूल को अनुमति देने के लिए, iframe में allow="tools" एट्रिब्यूट जोड़ें.
डेमो
इंपेरेटिव और डिक्लेरेटिव, दोनों तरह के तरीकों को लागू करने वाले डेमो के उदाहरण यहां दिए गए हैं:
- WebMCP zaMaker, WebMCP Imperative API का इस्तेमाल करता है.
- यात्रा का डेमो (React), WebMCP Imperative API का इस्तेमाल करता है.
- Le Petit Bistro demo, WebMCP Declarative API का इस्तेमाल करता है.
GitHub पर जाकर, डेमो के सोर्स कोड की समीक्षा की जा सकती है और उसे एक्सप्लोर किया जा सकता है.
Inspector एक्सटेंशन की मदद से, एजेंट से की गई चैट की नकल करना
Model Context Tool Inspector एक्सटेंशन इंस्टॉल करें. इससे आपको किसी एजेंट के साथ एक्सपेरिमेंट करने का मौका मिलेगा. साथ ही, यह देखने का मौका मिलेगा कि WebMCP टूल, लाइव डेमो या आपके अपने ऐप्लिकेशन में कैसे काम करते हैं. नैचुरल लैंग्वेज प्रॉम्प्ट का इस्तेमाल करके यह पता लगाएं कि एजेंट, WebMCP टूल के साथ उम्मीद के मुताबिक इंटरैक्ट करता है या नहीं.
इस एक्सटेंशन की मदद से, ये काम किए जा सकते हैं:
- WebMCP API को मॉनिटर करके, यह देखा जा सकता है कि किसी पेज पर कौनसे टूल रजिस्टर किए गए हैं.
- टूल को मैन्युअल तरीके से कॉल करें और फ़ंक्शन लागू करें.
- पुष्टि करें कि आपका JSON स्कीमा सही तरीके से तय किया गया हो और ब्राउज़र, टूल के हिसाब से डेटा को पार्स कर सकता हो.
- अपने टूल से मिले स्ट्रक्चर्ड आउटपुट या गड़बड़ी के मैसेज देखें. इससे यह पक्का किया जा सकेगा कि वे साफ़ तौर पर लिखे गए हैं और उनका फ़ॉर्मैट सही है, ताकि एजेंट उन्हें समझ सके.
नैचुरल लैंग्वेज का इस्तेमाल करके एजेंट से बात करें. इससे यह पता चलेगा कि एजेंट, WebMCP के सही टूल की पहचान कर सकता है या नहीं और उन्हें चालू कर सकता है या नहीं. आपके प्रॉम्प्ट, डिफ़ॉल्ट रूप से gemini-3-flash-preview मॉडल को भेजे जाते हैं.
सुझाव/राय देना या शिकायत करना
WebMCP पर अभी काम चल रहा है. आने वाले समय में, इसमें बदलाव हो सकता है. अगर आपने इन एपीआई को आज़माया है और आपको कोई सुझाव/राय देनी है या शिकायत करनी है, तो हमें ज़रूर बताएं.
- WebMCP के बारे में जानकारी देने वाला लेख पढ़ें. सवाल पूछें और चर्चा में हिस्सा लें.
- WebMCP इस्तेमाल करने के सबसे सही तरीके पढ़ें.
- Chrome Status पर जाकर, Chrome के लिए लागू करने की प्रोसेस देखें.
- अर्ली प्रीव्यू प्रोग्राम में शामिल हों. इससे आपको नए एपीआई के बारे में पहले से पता चल जाएगा. साथ ही, आपको हमारी मेलिंग लिस्ट का ऐक्सेस भी मिल जाएगा.
- अगर आपको Chrome में इस सुविधा को लागू करने के बारे में कोई सुझाव, शिकायत या राय देनी है, तो Chromium बग फ़ाइल करें.