पब्लिश किए जाने की तारीख: 14 मई, 2024
जब हम वेब पर एआई मॉडल की मदद से सुविधाएं बनाते हैं, तो अक्सर बड़े मॉडल के लिए, सर्वर-साइड के समाधानों का इस्तेमाल किया जाता है. यह खास तौर पर जनरेटिव एआई के लिए सही है, जहां यहां तक कि सबसे छोटे मॉडल भी वेब पेज का मीडियन साइज़. यह बात, एआई के इस्तेमाल के अन्य मामलों पर भी लागू होती है, जिनमें मॉडल 10 से 100 सेकंड तक के हो सकते हैं मेगाबाइट हो.
इन मॉडलों के बाद से, इन्हें सभी वेबसाइटों पर शेयर नहीं किया जाता है, पेज लोड होने पर हर साइट को उन्हें डाउनलोड करना पड़ता है. यह डेवलपर और उपयोगकर्ताओं के लिए एक असंभव समाधान है
बड़े मॉडल के लिए, सर्वर-साइड एआई एक बेहतरीन विकल्प है. हालांकि, डिवाइस पर मौजूद और हाइब्रिड तरीकों के अपने फ़ायदे हैं. इन तरीकों को काम का बनाने के लिए, हमें मॉडल के साइज़ और मॉडल की डिलीवरी से जुड़ी समस्याओं को हल करना होगा.
इसलिए, हम ऐसे वेब प्लैटफ़ॉर्म एपीआई और ब्राउज़र सुविधाएं डेवलप कर रहे हैं जो एआई मॉडल और लार्ज लैंग्वेज मॉडल (एलएलएम) को सीधे ब्राउज़र खोलें. इनमें Gemini Nano भी शामिल है. यह एलएलएम के Gemini फ़ैमिली का सबसे बेहतर वर्शन है. इसे ज़्यादातर आधुनिक डेस्कटॉप और लैपटॉप कंप्यूटर पर स्थानीय तौर पर चलाने के लिए डिज़ाइन किया गया है. पहले से मौजूद एआई की मदद से, आपकी वेबसाइट या वेब ऐप्लिकेशन, एआई की मदद से काम करने वाले टास्क को पूरा कर सकता है. इसके लिए, उसे अपने एआई मॉडल को डिप्लॉय या मैनेज करने की ज़रूरत नहीं होती.
जानें कि पहले से मौजूद एआई के फ़ायदे क्या हैं, इसे लागू करने का हमारा प्लान क्या है, और इस टेक्नोलॉजी का फ़ायदा कैसे लिया जा सकता है.
सार्वजनिक तौर पर उपलब्ध होने से पहले वर्शन का इस्तेमाल करना
एपीआई को बेहतर बनाने के लिए हमें आपके इनपुट की ज़रूरत है. और सुनिश्चित करें कि वे आपके उपयोग के मामलों को पूरा करते हैं और अन्य ब्राउज़र के साथ हमारी चर्चा एक तय मानकों को पूरा करने के लिए.
हमारे Early Preview कार्यक्रम में शामिल हों, ताकि पहले से मौजूद एआई के आइडिया पर सुझाव या राय देना और इस एक्सपेरिमेंट को आज़माने के लिए अवसर खोजना लोकल प्रोटोटाइपिंग के ज़रिए, मौजूदा एपीआई का इस्तेमाल कर रहे हैं.
नए एपीआई उपलब्ध होने पर सूचना पाने के लिए, Chrome के एआई डेवलपर के सार्वजनिक एलान वाले ग्रुप में शामिल हों.
वेब डेवलपर के लिए पहले से मौजूद एआई (AI) के फ़ायदे
पहले से मौजूद एआई की मदद से, आपका ब्राउज़र फ़ाउंडेशन और विशेषज्ञ मॉडल उपलब्ध कराता है और उन्हें मैनेज करता है.
डिवाइस पर मौजूद एआई की सुविधा को खुद से सेट अप करने के मुकाबले, पहले से मौजूद एआई की सुविधा के ये फ़ायदे हैं:
- डिप्लॉयमेंट में आसानी: जब ब्राउज़र मॉडल को डिस्ट्रिब्यूट करता है, तब यह डिवाइस की क्षमता को तय करती है और मॉडल के अपडेट को मैनेज करती है. यह यह मतलब है कि आप वेब ब्राउज़र पर बड़े मॉडल डाउनलोड या अपडेट करने के लिए नेटवर्क. आपको स्टोरेज खाली करने, रनटाइम मेमोरी बजट, सेवा देने की लागत, और अन्य समस्याओं को हल करने की ज़रूरत नहीं है.
- हार्डवेयर से तेज़ी लाने की सुविधा का ऐक्सेस: ब्राउज़र के एआई रनटाइम को इस तरह ऑप्टिमाइज़ किया जाता है कि यह उपलब्ध हार्डवेयर का पूरा फ़ायदा लें. फिर चाहे वह जीपीयू हो, एनपीयू हो या गिर रहा हो CPU पर वापस जा सकते हैं. इस वजह से, आपके ऐप्लिकेशन को हर डिवाइस पर सबसे अच्छी परफ़ॉर्मेंस मिल सकती है.
डिवाइस पर चलाने के फ़ायदे
पहले से मौजूद एआई की मदद से, डिवाइस पर एआई से जुड़े काम करना अब आसान हो जाता है इससे ये फ़ायदे मिलते हैं:
- संवेदनशील डेटा को लोकल प्रोसेसिंग: डिवाइस में मौजूद एआई (AI), आपके निजता बनाए रखने से जुड़ी स्टोरी. उदाहरण के लिए, संवेदनशील जानकारी का इस्तेमाल करने पर, एआई उपयोगकर्ताओं को दी जाने वाली सुविधाएं पूरी तरह सुरक्षित (E2EE) होती हैं.
- बेहतर उपयोगकर्ता अनुभव: कुछ मामलों में, दोतरफ़ा यात्रा के दौरान सर्वर का अर्थ है कि आप लगभग तुरंत परिणाम ऑफ़र कर सकते हैं. डिवाइस में मौजूद एआई उपयोगकर्ताओं को बेहतरीन अनुभव देने में मदद मिलती है.
- एआई का बेहतर ऐक्सेस: आपके उपयोगकर्ताओं की डिवाइस एक-दूसरे से कनेक्ट हो सकते हैं सुविधाओं का ज़्यादा ऐक्सेस देने के लिए लोड प्रोसेस करना. उदाहरण के लिए, अगर आपने एआई की प्रीमियम सुविधाएं ऑफ़र की हैं, तो डिवाइस पर मौजूद एआई की मदद से इन सुविधाओं की झलक दिखाई जा सकती है. इससे संभावित ग्राहक, आपके प्रॉडक्ट के फ़ायदे देख पाएंगे. इसके लिए, आपको कोई अतिरिक्त शुल्क नहीं देना होगा. इस हाइब्रिड तरीके से, आपको अनुमान लगाने की लागत को मैनेज करने में भी मदद मिल सकती है. खास तौर पर, अक्सर इस्तेमाल किए जाने वाले उपयोगकर्ता फ़्लो पर.
- ऑफ़लाइन एआई का इस्तेमाल: आपके उपयोगकर्ता, इंटरनेट कनेक्शन न होने पर भी एआई की सुविधाओं का इस्तेमाल कर सकते हैं. इसका मतलब है कि आपकी साइटें और वेब ऐप्लिकेशन, ऑफ़लाइन या इंटरनेट कनेक्शन में गड़बड़ी होने पर भी उम्मीद के मुताबिक काम कर सकते हैं.
हाइब्रिड एआई: डिवाइस पर और सर्वर-साइड
डिवाइस पर मौजूद एआई, इस्तेमाल के कई उदाहरणों को मैनेज कर सकता है. हालांकि, कुछ उदाहरणों के लिए, सर्वर साइड की मदद की ज़रूरत होती है.
उदाहरण के लिए, हो सकता है कि आपको बड़े मॉडल इस्तेमाल करने पड़ें या प्लैटफ़ॉर्म और डिवाइसों के बारे में बात करते हैं.
इन बातों के आधार पर, हाइब्रिड तरीके अपनाए जा सकते हैं:
- जटिलता: डिवाइस पर मौजूद एआई की मदद से, खास और आसानी से इस्तेमाल किए जा सकने वाले उदाहरणों को आसानी से इस्तेमाल किया जा सकता है. इस्तेमाल के मुश्किल उदाहरणों के लिए, सर्वर-साइड लागू करें.
- लचीलापन: डिफ़ॉल्ट रूप से सर्वर-साइड का इस्तेमाल करें और डिवाइस पर इंटरनेट कनेक्शन न हो या कनेक्शन में कोई रुकावट न हो.
- ग्रेसफ़ुल फ़ॉलबैक: एआई की सुविधा वाले ब्राउज़र को अपनाने में समय लगेगा. ऐसा हो सकता है कि कुछ मॉडल उपलब्ध न हों. साथ ही, हो सकता है कि पुराने या कम क्षमता वाले डिवाइस, सभी मॉडल को बेहतर तरीके से चलाने के लिए हार्डवेयर की ज़रूरी शर्तों को पूरा न कर पाएं. ऑफ़र इस्तेमाल करने वालों के लिए, सर्वर साइड एआई (AI) का भी इस्तेमाल किया जा सकता है.
Gemini मॉडल के लिए, Python, Go, Node.js या REST के साथ बैकएंड इंटिग्रेशन का इस्तेमाल किया जा सकता है. इसके अलावा, वेब के लिए Google एआई क्लाइंट SDK टूल की मदद से, अपने वेब ऐप्लिकेशन में इसे लागू किया जा सकता है.
ब्राउज़र का आर्किटेक्चर और एपीआई
Chrome में पहले से मौजूद एआई की मदद से, हमने फ़ाउंडेशन को ऐक्सेस करने के लिए इन्फ़्रास्ट्रक्चर बनाया साथ ही, विशेषज्ञों के मॉडल की मदद से उन्हें प्रोसेस करना आसान हो जाता है. यह इन्फ़्रास्ट्रक्चर, ब्राउज़र की इनोवेटिव सुविधाओं को पहले से ही बेहतर बना रहा है. जैसे, लिखने में मेरी मदद करो. साथ ही, यह जल्द ही डिवाइस पर मौजूद एआई के लिए एपीआई को बेहतर बना देगा.
एआई की पहले से मौजूद सुविधाओं को ऐक्सेस करने के लिए, मुख्य रूप से टास्क एपीआई का इस्तेमाल किया जाता है. जैसे, अनुवाद एपीआई या खास जानकारी देने वाला एपीआई. टास्क एपीआई को इस तरह डिज़ाइन किया गया है कि वे असाइनमेंट के लिए सबसे बेहतर मॉडल के आधार पर अनुमान लगा सकें.
Chrome में, ये एपीआई इस तरह बनाए गए हैं कि इनकी मदद से Gemini Nano से अनुमान लगाया जा सकता है ट्यूनिंग या एक्सपर्ट मॉडल का इस्तेमाल कर सकते हैं. Gemini Nano को ज़्यादातर आधुनिक डिवाइसों पर स्थानीय तौर पर चलाने के लिए डिज़ाइन किया गया है. यह भाषा से जुड़े इस्तेमाल के उदाहरणों के लिए सबसे अच्छा है. जैसे, खास जानकारी देना, फिर से लिखना या कैटगरी में बांटना.
साथ ही, हम एक्सप्लोरेटरी एपीआई भी उपलब्ध कराएंगे, ताकि आप स्थानीय तौर पर एक्सपेरिमेंट कर सकें और इस्तेमाल के अन्य उदाहरण शेयर कर सकें.
उदाहरण के लिए, हम ये सुविधाएं दे सकते हैं:
- Prompt API: Chrome में पहले से मौजूद लार्ज लैंग्वेज मॉडल (Gemini Nano) को, नैचुरल लैंग्वेज में कोई भी टास्क भेजें.
- फ़ाइन-ट्यूनिंग (LoRA) एपीआई: लो-रैंक अडैप्टेशन फ़ाइन-ट्यूनिंग की मदद से, मॉडल के वेट में बदलाव करके, किसी टास्क पर पहले से मौजूद एलएलएम की परफ़ॉर्मेंस को बेहतर बनाएं.
पहले से मौजूद एआई का इस्तेमाल कब करना चाहिए
हमें उम्मीद है कि पहले से मौजूद एआई से आपको और आपके उपयोगकर्ताओं को इन तरीकों से फ़ायदा मिल सकता है:
- एआई की मदद से कॉन्टेंट का बेहतर तरीके से इस्तेमाल करना: इसमें कॉन्टेंट की खास जानकारी देना, अनुवाद करना, कुछ कॉन्टेंट के बारे में सवालों के जवाब देना, कैटगरी तय करना, और कॉन्टेंट की विशेषताएं बताना शामिल है.
- एआई की मदद से कॉन्टेंट बनाना: जैसे, लिखने में मदद करना, प्रूफ़रीड करना, व्याकरण में सुधार करना, और वाक्यों को फिर से लिखना.
आगे क्या करना है
ये काम करने के लिए, हमारे शुरुआती झलक कार्यक्रम में शामिल हों पहले से मौजूद एआई एपीआई के साथ एक्सपेरिमेंट करें जो काफ़ी शुरुआती चरण में हैं.
इस दौरान, यह जानें कि Google के सर्वर पर Gemini Pro को इस्तेमाल करने का तरीक़ा, हमारी वेबसाइट और ऐप्लिकेशन में आपकी वेबसाइट और वेब ऐप्लिकेशन Google AI JavaScript SDK के लिए क्विकस्टार्ट.