पब्लिश की गई तारीख: 12 दिसंबर, 2024, आखिरी अपडेट: 20 मई, 2025
पहले से मौजूद एआई एपीआई की मदद से, आपका वेब ऐप्लिकेशन एआई की मदद से किए जाने वाले टास्क पूरे कर सकता है. इसके लिए, उसे अपने एआई मॉडल डिप्लॉय या मैनेज करने की ज़रूरत नहीं होती. हम इन एपीआई को सभी ब्राउज़र पर एक जैसा बनाने की कोशिश कर रहे हैं.
ज़रूरी शर्तें
पहले से मौजूद एआई का इस्तेमाल करने के लिए, मॉडल और हार्डवेयर से जुड़ी कुछ ज़रूरी शर्तें हैं.
मॉडल
Translator और Language Detector API, एक्सपर्ट मॉडल का इस्तेमाल करते हैं. अन्य सभी एपीआई, एक लैंग्वेज मॉडल का इस्तेमाल करते हैं. इसे डेस्कटॉप और लैपटॉप पर स्थानीय तौर पर चलाने के लिए डिज़ाइन किया गया है.
Summarizer API, Writer API, Rewriter API, और Proofreader API, सिर्फ़ टेक्स्ट-टू-टेक्स्ट मोडैलिटी के साथ काम करते हैं. Prompt API में मल्टीमॉडल की क्षमताएं हैं .
Chrome में Gemini Nano
Chrome, Gemini Nano लैंग्वेज मॉडल का इस्तेमाल करता है. Gemini Nano, फ़ोन या टैबलेट पर उपलब्ध नहीं है.
Chrome के 149वें वर्शन से, Gemini Nano, इनपुट और आउटपुट टेक्स्ट के लिए अंग्रेज़ी, स्पैनिश, जैपनीज़, जर्मन, और फ़्रेंच भाषाओं के साथ काम करता है.
हार्डवेयर
डेवलपर और Chrome में इन एपीआई का इस्तेमाल करके, सुविधाओं को ऑपरेट करने वाले उपयोगकर्ताओं के लिए ये ज़रूरी शर्तें हैं. अन्य ब्राउज़र में, ऑपरेटिंग से जुड़ी अलग-अलग ज़रूरी शर्तें हो सकती हैं.
Language Detector और Translator API , Chrome के डेस्कटॉप वर्शन पर काम करते हैं. ये एपीआई, फ़ोन या टैबलेट पर काम नहीं करते.
Prompt API, Summarizer API, Writer API, Rewriter API, और Proofreader API, Chrome में इन शर्तों के पूरा होने पर काम करते हैं:
- ऑपरेटिंग सिस्टम: Windows 10 या 11; macOS 13 और इसके बाद के वर्शन (Ventura और इसके बाद के वर्शन); Linux; या Chromebook Plus डिवाइसों पर ChromeOS (प्लेटफ़ॉर्म 16389.0.0 और इसके बाद के वर्शन). Gemini Nano का इस्तेमाल करने वाले एपीआई, फ़िलहाल Android, iOS, और ChromeOS के लिए Chrome के उन वर्शन के साथ काम नहीं करते जो Chromebook Plus डिवाइसों पर नहीं चलते.
- स्टोरेज: Chrome प्रोफ़ाइल वाले वॉल्यूम पर कम से कम 22 जीबी खाली जगह.
- जीपीयू या सीपीयू: पहले से मौजूद मॉडल, जीपीयू या सीपीयू के साथ काम कर सकते हैं.
- जीपीयू: चार जीबी से ज़्यादा VRAM.
- सीपीयू: 16 जीबी या इससे ज़्यादा रैम और चार या इससे ज़्यादा सीपीयू कोर.
- ध्यान दें: ऑडियो इनपुट के साथ Prompt API के लिए, जीपीयू की ज़रूरत होती है.
- नेटवर्क: अनलिमिटेड डेटा या ऐसा कनेक्शन जिस पर डेटा इस्तेमाल की कोई सीमा नहीं है. वाई-फ़ाई और ईथरनेट कनेक्शन आम तौर पर ऐसे होते हैं जिन पर डेटा से जुड़ी पाबंदी नहीं लगी होती . वहीं, सेल्युलर कनेक्शन अक्सर ऐसे होते हैं जिन पर डेटा से जुड़ी पाबंदी लगी होती है.
ब्राउज़र के मॉडल को अपडेट करने पर, Gemini Nano का साइज़ बदल सकता है. मौजूदा साइज़ जानने के लिए, chrome://on-device-internals पर जाएं.
बनाना शुरू करें
डेवलपमेंट के अलग-अलग चरणों में, पहले से मौजूद कई एआई एपीआई उपलब्ध हैं. कुछ एपीआई, Chrome के स्टेबल वर्शन में उपलब्ध हैं. कुछ एपीआई, ऑरिजिन ट्रायल में हिस्सा लेने वाले लोगों के लिए उपलब्ध हैं. वहीं, कुछ एपीआई, Early Preview Program में हिस्सा लेने वाले लोगों के लिए ही उपलब्ध हैं.
हर एपीआई के लिए, मॉडल को डाउनलोड करने और उसका इस्तेमाल शुरू करने के निर्देश अलग-अलग होते हैं. ये निर्देश, ऑरिजिन ट्रायल के साथ, स्थानीय तौर पर प्रोटोटाइप बनाने और प्रोडक्शन एनवायरमेंट, दोनों के लिए होते हैं.
- Translator API
- Language Detector API
- Summarizer API
- Writer API और Rewriter API
- Proofreader API
- Prompt API
Chrome एक्सटेंशन बनाते समय, इन सभी एपीआई का इस्तेमाल किया जा सकता है.
मॉडल डाउनलोड
एपीआई, Chrome में पहले से मौजूद होते हैं. मॉडल भी Chrome में पहले से मौजूद होते हैं. जब कोई उपयोगकर्ता पहली बार इन एपीआई के साथ इंटरैक्ट करता है, तो मॉडल को ब्राउज़र में डाउनलोड करना ज़रूरी होता है.
यह पता करने के लिए कि कोई एपीआई इस्तेमाल किया जा सकता है या नहीं और वह तैयार है या नहीं, एसिंक्रोनस availability() फ़ंक्शन को कॉल करें. यह फ़ंक्शन, इनमें से किसी एक वैल्यू के साथ प्रॉमिस दिखाता है:
"unavailable": उपयोगकर्ता का डिवाइस या अनुरोध किए गए सेशन के विकल्प काम नहीं करते. हो सकता है कि डिवाइस में ज़रूरत के मुताबिक पावर या डिस्क स्पेस न हो."downloadable": सेशन बनाने के लिए, अतिरिक्त डाउनलोड की ज़रूरत होती है. इनमें एक्सपर्ट मॉडल, लैंग्वेज मॉडल या फ़ाइन-ट्यूनिंग शामिल हो सकती है. उपयोगकर्ता की कार्रवाई को कॉल करने के लिए,create()की ज़रूरत पड़ सकती है."downloading": डाउनलोड जारी हैं और सेशन का इस्तेमाल करने से पहले, इन्हें पूरा करना होगा."available": सेशन तुरंत बनाया जा सकता है.
कुछ एपीआई के लिए, उपलब्धता को कॉल करते समय अतिरिक्त विकल्पों की ज़रूरत होती है. उदाहरण के लिए, Prompt API के लिए, भाषा के साथ काम करने की सुविधा का एलान करना ज़रूरी है:
// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });
उपयोगकर्ता की कार्रवाई
अगर डिवाइस, पहले से मौजूद एआई एपीआई के साथ काम कर सकता है, लेकिन मॉडल अब तक डाउनलोड नहीं हुआ है, तो आपके ऐप्लिकेशन को create() के साथ सेशन शुरू करने के लिए, उपयोगकर्ता को आपके पेज के साथ इंटरैक्ट करना होगा.
UserActivation.isActive
प्रॉपर्टी का इस्तेमाल करके, यह पुष्टि करें कि पेज लोड होने के बाद से, उपयोगकर्ता ने सीधे तौर पर पेज के साथ इंटरैक्ट किया है. इसमें टैप, क्लिक, की प्रेस, mousedown, या
अन्य स्टिकी ऐक्टिवेशन इवेंट शामिल हो सकते हैं.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
उदाहरण के लिए, Summarizer API के साथ, उपयोगकर्ताओं से "Summarize" बटन के साथ इंटरैक्ट करने के लिए कहा जा सकता है, ताकि
Summarizer.create() को चालू किया जा सके. इसके अलावा, उपयोगकर्ता के टाइप करना शुरू करने के बाद,
इवेंट के बाद, समराइज़र बनाया जा सकता है.keydown
लोकलहोस्ट पर एपीआई का इस्तेमाल करना
Chrome में, सभी एपीआई localhost पर उपलब्ध हैं.
chrome://flags/#optimization-guide-on-device-modelपर जाएं.- चालू करें को चुनें.
- फिर से लॉन्च करें पर क्लिक करें या Chrome को रीस्टार्ट करें.
Gemini Nano का इस्तेमाल करने वाले एपीआई के लिए, आपको chrome://flags/#prompt-api-for-gemini-nano को चालू करें या बहुभाषी चालू करें पर भी सेट करना होगा. DevTools कंसोल में, यह पुष्टि की जा सकती है कि मॉडल डाउनलोड हो गया है और वह उम्मीद के मुताबिक काम कर रहा है
.
कंसोल में await LanguageModel.availability(); चलाएं.
लोकलहोस्ट की समस्याओं को हल करना
अगर फ़्लैग, chrome://flags में नहीं दिखते हैं, तो पक्का करें कि आपने
Chrome का नया वर्शन डाउनलोड किया हो.
अगर मॉडल उम्मीद के मुताबिक काम नहीं करता है, तो यह तरीका अपनाएं:
- Chrome को रीस्टार्ट करें.
chrome://on-device-internalsपर जाएं.- मॉडल की स्थिति टैब चुनें और पक्का करें कि कोई गड़बड़ी न हो.
- DevTools खोलें और कंसोल में
LanguageModel.availability();टाइप करें. इससेavailableदिखना चाहिए.
ज़रूरत पड़ने पर, कुछ समय इंतज़ार करें और यह तरीका फिर से अपनाएं.
स्टैंडर्ड प्रोसेस
हम इन एपीआई को स्टैंडर्ड बनाने की कोशिश कर रहे हैं, ताकि ये सभी ब्राउज़र पर काम कर सकें. इसका मतलब है कि हमने वेब प्लैटफ़ॉर्म कम्यूनिटी को एपीआई का सुझाव दिया है. साथ ही, हमने इन्हें आगे की चर्चा के लिए, W3C Web Incubator Community Group में भेज दिया है.
हम हर एपीआई के लिए, W3C, Mozilla, और WebKit से सुझाव/राय/शिकायतें मांग रहे हैं.
जुड़ें और सुझाव/राय/शिकायतें शेयर करें
अगर आपने पहले से मौजूद एआई को आज़माया है और आपके पास कोई सुझाव/राय/शिकायत है, तो हमें बताएं.
- पहले से मौजूद सभी एआई एपीआई के बारे में जानें.
- नए एपीआई को रिलीज़ होने से पहले देखने और हमारी मेलिंग सूची का ऐक्सेस पाने के लिए, Early Preview Program में शामिल हों.
- अगर आपके पास Chrome के लागू करने के तरीके के बारे में कोई सुझाव/राय/शिकायत है, तो Chromium में कोई गड़बड़ी दर्ज करें.
- वेब स्टैंडर्ड के बारे में जानें.