WebMCP

Alexandra Klepper
Alexandra Klepper

पब्लिश होने की तारीख: 18 मई, 2026, पिछली बार अपडेट किए जाने की तारीख: 28 मई, 2026

WebMCP एक प्रस्तावित वेब स्टैंडर्ड है. इससे आपको एआई एजेंट के लिए स्ट्रक्चर्ड टूल बनाने और उन्हें उपलब्ध कराने में मदद मिलती है. WebMCP, JavaScript उपलब्ध कराता है और एचटीएमएल फ़ॉर्म एलिमेंट को एनोटेट करता है. इससे एजेंट को यह पता चलता है कि पेज की सुविधाओं के साथ कैसे इंटरैक्ट करना है, ताकि उपयोगकर्ता को बेहतर अनुभव मिल सके. इससे एजेंट ऐक्टिवेशन की परफ़ॉर्मेंस और भरोसेमंद होने की क्षमता में काफ़ी सुधार हो सकता है.

एआई एजेंट, नई टेक्नोलॉजी हैं. ये इंसानों को ऐसे मुश्किल और तकनीकी काम बेहतर तरीके से पूरे करने में मदद कर सकते हैं. WebMCP, एजेंट की मदद से टास्क पूरा करने के लिए ज़्यादा सटीक नतीजे देता है. इसे प्रोग्रेसिव एन्हांसमेंट के तौर पर जोड़ा जा सकता है.

WebMCP का इस्तेमाल क्यों करें?

WebMCP, वेब ऐप्लिकेशन और एजेंट के बीच के अंतर को कम करने में आपकी मदद कर सकता है. साथ ही, इंटरैक्शन के लिए नियम तय करके, दक्षता, भरोसेमंद तरीके से काम करने, और टास्क पूरा करने की क्षमता को बेहतर बना सकता है. बटन या फ़ील्ड जैसे एलिमेंट की समीक्षा करने के लिए, किसी एजेंट की ज़रूरत नहीं होती. वेबसाइट, एलिमेंट के मकसद के बारे में बताती है, ताकि उसका सही तरीके से इस्तेमाल किया जा सके

यह ऐक्चुएशन से ज़्यादा भरोसेमंद है. ऐक्चुएशन में कई चरण हो सकते हैं और हर चरण को एजेंट के हिसाब से तय किया जाता है.

वेबसाइटें, tool को तय करके, खोज या खरीदारी जैसे मकसद के बारे में साफ़ तौर पर बता सकती हैं. टूल, आपके वेबपेज पर साफ़ तौर पर काम करते हैं. इसलिए, उपयोगकर्ताओं को भरोसा होता है कि टास्क उनकी उम्मीद के मुताबिक पूरे किए जा रहे हैं. इससे आपके ब्रैंड और लोगों की ज़रूरतों को ध्यान में रखकर किए गए डिज़ाइन के विकल्पों को भी सुरक्षित रखा जा सकता है.

WebMCP इनके साथ काम करता है:

  • डिस्कवरी: पेजों के लिए, एजेंट के साथ टूल रजिस्टर करने का स्टैंडर्ड तरीका. जैसे, checkout या filter_results.
  • JSON स्कीमा: इसमें इनपुट और अनुमानित आउटपुट की साफ़ तौर पर जानकारी दी जाती है, ताकि एआई के जवाब में तथ्यों के ग़लत होने या गलतफ़हमी होने की संभावना कम हो.
  • स्टेट: इससे एजेंट को मौजूदा पेज के कॉन्टेक्स्ट के बारे में जानकारी मिलती है. इससे एजेंट को पता चलता है कि रीयल टाइम में कार्रवाई करने के लिए, कौनसे संसाधन उपलब्ध हैं.

हमारा लक्ष्य ऐसे एपीआई बनाना है जिन्हें एजेंट की क्षमताओं वाला कोई भी ब्राउज़र लागू कर सकता है और उनसे फ़ायदा पा सकता है. इससे आपके उपयोगकर्ता आसानी से टास्क पूरे कर पाएंगे. GitHub पर इस प्रोसेस को फ़ॉलो किया जा सकता है.

उपयोग के उदाहरण

वेब पर WebMCP का इस्तेमाल कई तरीकों से किया जा सकता है. उदाहरण के लिए:

  • अपने खरीदारों को सहायता पाने में मदद करें. अगर आपको ग्राहकों को सॉफ़्टवेयर उपलब्ध कराना है, तो आपको सहायता से जुड़ी जटिल प्रोसेस अपनानी पड़ सकती है, ताकि अलग-अलग सवालों के जवाब दिए जा सकें. WebMCP का इस्तेमाल करके, एजेंट को सही फ़ॉर्म पर तेज़ी से ले जाया जा सकता है. साथ ही, उपयोगकर्ता से मिली जानकारी को फ़ील्ड में भरा जा सकता है.
  • यात्रा की बुकिंग को बेहतर बनाना. एजेंट को कम चरणों में, मुश्किल, एक से ज़्यादा शहरों की यात्रा, और एक से ज़्यादा यात्रियों की यात्रा बुक करने में मदद करें.

कुछ कार्रवाइयां संवेदनशील हो सकती हैं. जैसे, खरीदारी करना. पुष्टि करने वाले डायलॉग के साथ उपयोगकर्ता के इंटरैक्शन का अनुरोध करने के लिए, एक कमांड शामिल की जा सकती है.

आपके टूल, ये काम कर सकते हैं:

  • स्ट्रक्चर्ड फ़ॉर्म भरना: एक submit_application टूल बनाएं. इससे एजेंट को, उपयोगकर्ता के साथ हुई बातचीत से इकट्ठा किए गए डेटा को फ़ॉर्म फ़ील्ड में सही तरीके से मैप करने में मदद मिलेगी. उदाहरण के लिए, यह तय किया जा सकता है कि किसी फ़ील्ड में पूरा नाम डालना ज़रूरी है या पहला और आखिरी नाम अलग-अलग डालना है.
  • ऐसे इंटरफ़ेस में सहायता एजेंट के इंटरैक्शन जो इंसानों के लिए बनाए गए हैं: कुछ फ़ील्ड इंसानों के लिए डिज़ाइन किए गए हैं, लेकिन हो सकता है कि एजेंट उन्हें न समझ पाएं. date_pick टूल बनाया जा सकता है. इसकी मदद से, बुकिंग या इवेंट के लिए तारीख और समय को आसानी से चुना जा सकता है.
  • ऐप्लिकेशन को तेज़ी से डीबग करना: डेवलपर सेटिंग वाले पेज पर run_diagnostics टूल बनाया जा सकता है. इससे एजेंट, उन फ़िक्स को ट्रिगर कर सकता है जो नेस्ट किए गए मेन्यू में छिपे होते हैं.

क्या आपके इस्तेमाल का उदाहरण मौजूद नहीं है? या क्या आपके पास WebMCP के लिए कोई ऐसा आइडिया है जिसे शेयर करने के लिए आप उत्साहित हैं? अर्ली प्रीव्यू प्रोग्राम में शामिल हों और अपने सुझाव/राय दें या शिकायत करें.

अपनी प्रोफ़ाइल बनाना शुरू करें

WebMCP, लोकल डेवलपमेंट के लिए Chrome फ़्लैग के तौर पर उपलब्ध है. यह Chrome 149 में ऑरिजिन ट्रायल के तौर पर उपलब्ध होगा.

WebMCP को स्थानीय तौर पर चालू करने के लिए:

  1. Chrome खोलें और chrome://flags/#enable-webmcp-testing पर जाएं
  2. फ़्लैग को चालू है पर सेट करें.
  3. बदलाव लागू करने के लिए, Chrome को फिर से लॉन्च करें.

WebMCP API का इस्तेमाल करना

वेबसाइट के टूल सेट अप करने के लिए, इन दो एपीआई का इस्तेमाल किया जा सकता है:

  • इंपरेटिव एपीआई: स्टैंडर्ड JavaScript की मदद से, अलग-अलग तरह के टूल तय करें. जैसे, फ़ॉर्म इनपुट, नेविगेशन टूल, स्टेट मैनेजमेंट या अन्य फ़ंक्शन.
  • डिक्लेरेटिव एपीआई: WebMCP टूल बनाने के लिए, स्टैंडर्ड एचटीएमएल फ़ॉर्म में एनोटेशन जोड़ें.

सीमाएं

WebMCP का मकसद, एजेंट और लोगों के लिए मुश्किल टास्क को आसान बनाना है. हालांकि, इसकी कुछ सीमाएं हैं:

  • ब्राउज़िंग कॉन्टेक्स्ट ज़रूरी है: टूल कॉल को JavaScript में हैंडल किया जाता है. इसलिए, ब्राउज़र टैब या वेबव्यू को खोलना ज़रूरी है, ताकि दिखने वाला इंटरफ़ेस और ब्राउज़र कॉन्टेक्स्ट उपलब्ध कराया जा सके. दूसरे शब्दों में कहें, तो हेडलेस मोड में कॉल करने वाले टूल के लिए, एजेंट या सहायता करने वाले टूल काम नहीं करते.
  • जटिल इंटरफ़ेस के लिए ज़्यादा ओवरहेड: अगर आपकी साइट बहुत जटिल है, तो आपको ऐप्लिकेशन और इंटरफ़ेस की स्थिति को मैनेज करने के लिए, JavaScript को फिर से फ़ैक्टर करना होगा या उसे जोड़ना होगा.
  • टूल का पता लगाना: क्लाइंट और ब्राउज़र को सीधे तौर पर किसी साइट पर जाना होगा, ताकि यह पता चल सके कि उसमें कॉल किए जा सकने वाले टूल हैं या नहीं.

अनुमतियों की नीति

दोनों एपीआई, tools अनुमतियों की नीति के तहत आते हैं. नीति की डिफ़ॉल्ट वैल्यू self होती है. इससे टॉप-लेवल और एक ही ऑरिजिन वाले कॉन्टेक्स्ट में टूल रजिस्टर करने की अनुमति मिलती है. साथ ही, क्रॉस-ऑरिजिन iframe के लिए इसे बंद कर दिया जाता है.

क्रॉस-ऑरिजिन iframe में WebMCP टूल को अनुमति देने के लिए, iframe में allow="tools" एट्रिब्यूट जोड़ें.

डेमो

इंपेरेटिव और डिक्लेरेटिव, दोनों तरह के तरीकों को लागू करने वाले डेमो के उदाहरण यहां दिए गए हैं:

GitHub पर जाकर, डेमो के सोर्स कोड की समीक्षा की जा सकती है और उसे एक्सप्लोर किया जा सकता है.

Inspector एक्सटेंशन की मदद से, एजेंट से की गई चैट की नकल करना

Model Context Tool Inspector एक्सटेंशन इंस्टॉल करें. इससे आपको एजेंट के साथ एक्सपेरिमेंट करने का मौका मिलेगा. साथ ही, यह देखने का मौका मिलेगा कि WebMCP टूल, लाइव डेमो या आपके ऐप्लिकेशन में कैसे काम करते हैं. नैचुरल लैंग्वेज प्रॉम्प्ट का इस्तेमाल करके यह पता लगाएं कि एजेंट, WebMCP टूल के साथ उम्मीद के मुताबिक इंटरैक्ट कर रहा है या नहीं.

इस एक्सटेंशन की मदद से, ये काम किए जा सकते हैं:

  • WebMCP API को मॉनिटर करके, यह देखा जा सकता है कि किसी पेज पर कौनसे टूल रजिस्टर किए गए हैं.
  • टूल को मैन्युअल तरीके से कॉल करें और फ़ंक्शन लागू करें.
  • पुष्टि करें कि आपका JSON स्कीमा सही तरीके से तय किया गया हो और ब्राउज़र, टूल के हिसाब से डेटा को पार्स कर सकता हो.
  • अपने टूल से मिले स्ट्रक्चर्ड आउटपुट या गड़बड़ी के मैसेज देखें. इससे यह पक्का किया जा सकेगा कि वे साफ़ तौर पर लिखे गए हैं और उनका फ़ॉर्मैट सही है, ताकि एजेंट उन्हें समझ सके.

एजेंट से आम बोलचाल की भाषा में बात करें. इससे यह पता चलेगा कि वह WebMCP के सही टूल की पहचान कर सकता है और उन्हें चालू कर सकता है या नहीं. आपके प्रॉम्प्ट, डिफ़ॉल्ट रूप से gemini-3-flash-preview मॉडल को भेजे जाते हैं.

सुझाव/राय देना या शिकायत करना

WebMCP पर अब भी काम चल रहा है. इसलिए, आने वाले समय में इसमें बदलाव हो सकता है. अगर आपने इन एपीआई को आज़माया है और आपके पास कोई सुझाव, शिकायत या राय है, तो हमें ज़रूर बताएं.