पहले से मौजूद एआई

Kenji Baheux
Kenji Baheux
Alexandra Klepper
Alexandra Klepper

वेब पर एआई मॉडल की मदद से सुविधाएं बनाते समय, हम अक्सर बड़े मॉडल के लिए, सर्वर साइड समाधान पर भरोसा करते हैं. यह खास तौर पर जनरेटिव एआई के लिए सही है, जहां सबसे छोटे मॉडल भी मीडियन वेब पेज के साइज़ से करीब हज़ार गुना बड़े होते हैं. एआई (AI) के इस्तेमाल के अन्य मामलों में भी ऐसा ही होता है, जहां मॉडल की रेंज 10 सेकंड से लेकर 100 सेकंड तक हो सकती है.

ये मॉडल सभी वेबसाइटों पर शेयर नहीं किए जाते. इसलिए, हर साइट को इन्हें पेज लोड पर डाउनलोड करना होगा. यह डेवलपर और उपयोगकर्ताओं के लिए एक अव्यवहारिक समाधान है

बड़े मॉडल के लिए, सर्वर साइड एआई एक अच्छा विकल्प है. हालांकि, डिवाइस पर मौजूद और हाइब्रिड मॉडल के अपने अलग-अलग पहलू होते हैं. इन तरीकों को कारगर बनाने के लिए, हमें मॉडल साइज़ और मॉडल डिलीवरी पर ध्यान देना होगा.

इसलिए, हम वेब प्लैटफ़ॉर्म एपीआई और ब्राउज़र की ऐसी सुविधाएं डेवलप कर रहे हैं जिन्हें एआई मॉडल को सीधे ब्राउज़र में इंटिग्रेट करने के लिए डिज़ाइन किया गया है. इन मॉडल में बड़े लैंग्वेज मॉडल (एलएलएम) भी शामिल हैं. इसमें Gemini Nano, एलएलएम के Gemini परिवार का सबसे बेहतर वर्शन है. इसे ज़्यादातर आधुनिक डेस्कटॉप और लैपटॉप कंप्यूटर पर चलाने के लिए डिज़ाइन किया गया है. आपकी वेबसाइट या वेब ऐप्लिकेशन में पहले से मौजूद एआई की मदद से, इससे जुड़े काम किए जा सकते हैं. इसके लिए, उन्हें अपने एआई मॉडल को डिप्लॉय या मैनेज करने की ज़रूरत नहीं है.

पहले से मौजूद एआई (AI) के फ़ायदों और इसे लागू करने की हमारी योजना के बारे में जानें. साथ ही, यह भी जानें कि इस टेक्नोलॉजी का फ़ायदा कैसे लिया जा सकता है.

सार्वजनिक तौर पर रिलीज़ होने से पहले, झलक देखने की सुविधा पाएं

हमें एपीआई को बेहतर बनाने के लिए आपके इनपुट की ज़रूरत है. साथ ही, यह पक्का करें कि वे आपके इस्तेमाल के उदाहरणों के मुताबिक हों. साथ ही, स्टैंडर्ड तय करने के लिए, हमें दूसरे ब्राउज़र वेंडर के साथ हुई बातचीत की जानकारी दें.

हमारे Early Preview प्रोग्राम में शामिल हों. इसमें, एआई में पहले से मौजूद आइडिया के बारे में सुझाव/राय दें या शिकायत करें. साथ ही, लोकल प्रोटोटाइपिंग के ज़रिए, उन एपीआई को टेस्ट करने के अवसर खोजें जिन पर अभी काम चल रहा है.

नए एपीआई उपलब्ध होने पर सूचना पाने के लिए, Chrome एआई डेवलपर के सार्वजनिक एलान वाले ग्रुप में शामिल हों.

वेब डेवलपर के लिए, पहले से मौजूद एआई (AI) के फ़ायदे

आपका ब्राउज़र, पहले से मौजूद एआई की मदद से, बुनियादी जानकारी और विशेषज्ञ के मॉडल उपलब्ध कराता है और उन्हें मैनेज करता है.

डिवाइस में मौजूद एआई का इस्तेमाल करने की तुलना में, पहले से मौजूद एआई के ये फ़ायदे हैं:

  • डिप्लॉयमेंट में आसान: ब्राउज़र, मॉडल को डिस्ट्रिब्यूट करते समय, डिवाइस की क्षमता को ध्यान में रखता है. साथ ही, मॉडल के अपडेट को मैनेज करता है. इसका मतलब है कि किसी नेटवर्क पर बड़े मॉडल डाउनलोड या अपडेट करने की ज़िम्मेदारी आपकी नहीं है. आपको स्टोरेज, रनटाइम, मेमोरी बजट, सेवा की लागत, और अन्य चुनौतियों को हल करने की ज़रूरत नहीं है.
  • हार्डवेयर से तेज़ी लाने का ऐक्सेस: ब्राउज़र के एआई रनटाइम को उपलब्ध हार्डवेयर का ज़्यादा से ज़्यादा फ़ायदा पाने के लिए ऑप्टिमाइज़ किया गया है. भले ही, वह जीपीयू, एनपीयू हो या सीपीयू पर वापस जाने के लिए तैयार हो. ऐसा होने पर, आपके ऐप्लिकेशन की परफ़ॉर्मेंस हर डिवाइस पर सबसे अच्छी हो सकती है.

डिवाइस पर चलाने के फ़ायदे

पहले से मौजूद एआई (AI) के साथ, डिवाइस पर एआई से जुड़े टास्क करना आसान हो जाता है. इससे ये फ़ायदे मिलते हैं:

  • संवेदनशील डेटा को लोकल तौर पर प्रोसेस करना: डिवाइस पर मौजूद एआई (AI), आपकी निजता की कहानी को बेहतर बना सकता है. उदाहरण के लिए, संवेदनशील जानकारी का इस्तेमाल करने पर, उपयोगकर्ताओं को एंड-टू-एंड एन्क्रिप्शन (E2EE) की मदद से, एआई की सुविधाएं दी जा सकती हैं.
  • स्नैपी उपयोगकर्ता अनुभव: कुछ मामलों में, सर्वर का इस्तेमाल न करने का मतलब होता है कि आपको तुरंत नतीजे मिल सकते हैं. डिवाइस पर मौजूद एआई, इस्तेमाल न की जा सकने वाली सुविधा और उपयोगकर्ता के अनुभव को बेहतर बनाने के बीच का फ़र्क़ हो सकता है.
  • एआई का बेहतर ऐक्सेस: आपके उपयोगकर्ताओं के डिवाइस, सुविधाओं का ज़्यादा ऐक्सेस पाने के लिए, अपने ऐप्लिकेशन को प्रोसेस करने से कुछ ज़्यादा काम ले सकते हैं. उदाहरण के लिए, अगर एआई की प्रीमियम सुविधाएं ऑफ़र की जाती हैं, तो उपयोगकर्ता के डिवाइस पर एआई की मदद से इन सुविधाओं की झलक देखी जा सकती है. इससे संभावित ग्राहकों को आपके प्रॉडक्ट के फ़ायदे पता होंगे. इसके लिए, उन्हें अलग से शुल्क नहीं देना होगा. इस हाइब्रिड तरीके से, अनुमान की कीमतों को मैनेज करने में भी मदद मिल सकती है. खास तौर पर, अक्सर इस्तेमाल किए जाने वाले यूज़र फ़्लो.
  • ऑफ़लाइन एआई का इस्तेमाल: इंटरनेट कनेक्शन न होने पर भी, आपके उपयोगकर्ता एआई की सुविधाएं ऐक्सेस कर सकते हैं. इसका मतलब है कि आपकी साइटें और वेब ऐप्लिकेशन, ऑफ़लाइन या वैरिएबल कनेक्टिविटी के साथ उम्मीद के मुताबिक काम कर सकते हैं.

हाइब्रिड एआई: उपयोगकर्ता के डिवाइस पर और सर्वर-साइड पर

डिवाइस पर मौजूद एआई कई तरह से काम कर सकता है. हालांकि, कुछ मामलों में सर्वर-साइड की सुविधा की ज़रूरत होती है.

उदाहरण के लिए, आपको बड़े मॉडल इस्तेमाल करने पड़ सकते हैं या कई प्लैटफ़ॉर्म और डिवाइसों पर काम करना पड़ सकता है.

इन बातों को ध्यान में रखते हुए, हाइब्रिड मॉडल को अपनाया जा सकता है:

  • समस्या का लेवल: उपयोगकर्ता के डिवाइस पर मौजूद एआई की मदद से, इस्तेमाल के खास और आसान उदाहरण आसानी से पूरे किए जा सकते हैं. जटिल इस्तेमाल के मामलों के लिए, सर्वर-साइड लागू करने के विकल्प पर विचार करें.
  • लचीलापन: डिफ़ॉल्ट रूप से सर्वर-साइड का इस्तेमाल करें. साथ ही, डिवाइस के ऑफ़लाइन होने या खराब कनेक्शन पर होने पर, इसका इस्तेमाल डिवाइस पर करें.
  • बेहतर फ़ॉलबैक: पहले से मौजूद एआई (AI) वाले ब्राउज़र इस्तेमाल करने में समय लगता है. ऐसा हो सकता है कि कुछ मॉडल उपलब्ध न हों. साथ ही, हो सकता है कि पुराने या कम ताकतवर डिवाइस, सभी मॉडल को बेहतर तरीके से चलाने के लिए हार्डवेयर की ज़रूरी शर्तों को पूरा न कर पाएं. ऐसे उपयोगकर्ताओं को सर्वर-साइड एआई की सुविधा दें.

Gemini मॉडल के लिए बैकएंड इंटिग्रेशन (Python, Go, Node.js या REST के साथ) का इस्तेमाल किया जा सकता है या इसे अपने वेब ऐप्लिकेशन में लागू करने के लिए, वेब के लिए Google AI क्लाइंट SDK के नए वर्शन का इस्तेमाल किया जा सकता है.

ब्राउज़र आर्किटेक्चर और एपीआई

Chrome में पहले से मौजूद एआई की सुविधा को सपोर्ट करने के लिए, हमने फ़ाउंडेशन और विशेषज्ञ मॉडल को ऐक्सेस करने के लिए इन्फ़्रास्ट्रक्चर बनाया है, ताकि डिवाइस पर एक्ज़ीक्यूशन किया जा सके. यह इन्फ़्रास्ट्रक्चर पहले से ही लिखने में मेरी मदद करें जैसी ब्राउज़र की नई सुविधाओं को बेहतर बना रहा है. इससे डिवाइस पर मौजूद एआई (AI) को जल्द ही एपीआई का इस्तेमाल करने में मदद मिलेगी.

आपको मुख्य तौर पर, Tasks के एपीआई के साथ पहले से मौजूद एआई सुविधाओं का ऐक्सेस मिलेगा. जैसे, अनुवाद एपीआई या खास जानकारी वाला एपीआई. टास्क एपीआई को असाइनमेंट के सबसे अच्छे मॉडल के मुकाबले, अनुमान लगाने के लिए डिज़ाइन किया गया है.

Chrome में ये एपीआई इस तरह बनाए गए हैं कि Gemini Nano की परफ़ॉर्मेंस का अनुमान लगाया जा सके और इसके लिए फ़ाइन-ट्यूनिंग या विशेषज्ञ के मॉडल का इस्तेमाल किया जा सके. Gemini Nano, ज़्यादातर आधुनिक डिवाइसों पर काम करता है. इसका इस्तेमाल भाषा से जुड़े इस्तेमाल के लिए किया जा सकता है. जैसे, खास जानकारी देना, किसी टेक्स्ट को अलग तरीके से लिखना या अलग-अलग कैटगरी में बांटना.

साथ ही, हम एक्सप्लोरेट्री एपीआई उपलब्ध कराना चाहते हैं, ताकि आप स्थानीय तौर पर प्रयोग कर सकें और इस्तेमाल के अन्य उदाहरणों को शेयर कर सकें.

उदाहरण के लिए, हम यह जानकारी दे सकते हैं:

  • Prompt API: बिल्ट-इन लार्ज लैंग्वेज मॉडल (Chrome में Gemini नैनो) पर, नैचुरल लैंग्वेज में दिखाया गया कोई आर्बिट्रेरी टास्क भेजें.
  • फ़ाइन-ट्यूनिंग (LoRA) एपीआई: कम रैंक वाले अडैप्टेशन की मदद से, मॉडल की वेट अडजस्ट करके, पहले से मौजूद एलएलएम की परफ़ॉर्मेंस को बेहतर बनाएं.
इस डायग्राम में बताया गया है कि आपकी वेबसाइट या ऐप्लिकेशन, Chrome में पहले से मौजूद मॉडल को ऐक्सेस करने के लिए, टास्क और एक्सप्लोरेट्री वेब प्लैटफ़ॉर्म एपीआई का कैसे इस्तेमाल कर सकता है.

पहले से मौजूद एआई का इस्तेमाल कब करें

हम उम्मीद करते हैं कि पहले से मौजूद एआई, आपको और आपके उपयोगकर्ताओं को इन तरीकों से फ़ायदा पहुंचा सकता है:

  • एआई की मदद से बेहतर कॉन्टेंट का इस्तेमाल करना: इसमें, खास जानकारी देना, अनुवाद, कुछ कॉन्टेंट से जुड़े सवालों के जवाब देना, कॉन्टेंट की कैटगरी तय करना, और उसकी विशेषताएं बताना शामिल है.
  • एआई की मदद से कॉन्टेंट बनाने की सुविधा: जैसे, कॉन्टेंट लिखने में मदद पाना, प्रूफ़रीडिंग, व्याकरण में सुधार करना, और अलग-अलग शब्दों में लिखना.

आगे क्या करना है

पहले से मौजूद एआई एपीआई को आज़माने के लिए, हमारे रिलीज़ होने से पहले झलक दिखाने वाले प्रोग्राम में शामिल हों.

इस बीच, Google AI JavaScript SDK के लिए हमारे क्विकस्टार्ट की मदद से, अपनी वेबसाइटों और वेब ऐप्लिकेशन के साथ Google के सर्वर पर Gemini Pro को इस्तेमाल करने का तरीका जाना जा सकता है.