आर्टिफ़िशियल इंटेलिजेंस क्या है?

Alexandra Klepper
Alexandra Klepper

आर्टिफ़िशियल इंटेलिजेंस (एआई) में कई जटिल और नई टेक्नोलॉजी शामिल हैं. पहले इन टेक्नोलॉजी के लिए इंसानों के इनपुट की ज़रूरत होती थी, लेकिन अब इन्हें कंप्यूटर की मदद से पूरा किया जा सकता है. सामान्य तौर पर, एआई एक ऐसा प्रोग्राम या मॉडल है जो इंसानों के अलावा किसी और के ज़रिए बनाया गया है. यह कई तरह की समस्याओं को हल करने और क्रिएटिविटी दिखाने में मदद करता है.

एआई शब्द का इस्तेमाल अक्सर आर्टिफ़िशियल इंटेलिजेंस के क्षेत्र में अलग-अलग तरह की टेक्नोलॉजी को दिखाने के लिए किया जाता है. हालांकि, इनके स्कोप में काफ़ी अंतर हो सकता है.

आर्टिफ़िशियल इंटेलिजेंस और मशीन लर्निंग को समझने के लिए, कई शब्द और कॉन्सेप्ट हैं. ये आपके काम आ सकते हैं. यहां आपको Chrome के दस्तावेज़ में इस्तेमाल होने वाले सामान्य शब्द मिलेंगे. इनमें सबसे अहम, क्लाइंट-साइड एआई से जुड़े शब्द हैं.

क्लाइंट-साइड एआई

वेब पर मौजूद ज़्यादातर एआई सुविधाएं, सर्वर पर काम करती हैं. हालांकि, क्लाइंट-साइड एआई, उपयोगकर्ता के ब्राउज़र में काम करता है और उपयोगकर्ता के डिवाइस पर अनुमान लगाता है. इसके कई फ़ायदे हैं. जैसे, कम समय में डेटा ट्रांसफ़र होना, सुविधाओं को बनाने में कम लागत लगना, उपयोगकर्ता की निजता बढ़ना, और ऑफ़लाइन ऐक्सेस.

क्लाइंट-साइड एआई, छोटे और ऑप्टिमाइज़ किए गए मॉडल पर काम करता है. ये मॉडल परफ़ॉर्मेंस के लिए ऑप्टिमाइज़ किए जाते हैं. ऐसा हो सकता है कि ये मॉडल, सर्वर साइड के बड़े मॉडल से बेहतर परफ़ॉर्म करें. अपने इस्तेमाल के उदाहरण का आकलन करें, ताकि यह तय किया जा सके कि आपके लिए कौनसा समाधान सही है.

पहले से मौजूद एआई

एआई की सुविधा पहले से मौजूद होने की वजह से, आपकी वेबसाइट ब्राउज़र एपीआई के ज़रिए लोकल प्रोसेसर से कनेक्ट होती है. ब्राउज़र में पहले से मौजूद मॉडल, जवाब भेजता है. इसके बाद, एपीआई आपकी वेबसाइट को जवाब भेजता है.

पहले से मौजूद एआई, क्लाइंट-साइड एआई का एक रूप है. इसमें छोटे मॉडल, ब्राउज़र में पहले से मौजूद होते हैं. Chrome के लिए, इसमें Gemini Nano और एक्सपर्ट मॉडल शामिल हैं. इन मॉडल को डाउनलोड करने के बाद, एआई की सुविधा का इस्तेमाल करने वाली सभी वेबसाइटें और वेब ऐप्लिकेशन, डाउनलोड करने में लगने वाले समय को छोड़कर सीधे सुविधा को लागू कर सकते हैं और लोकल इन्फ़रेंस का इस्तेमाल कर सकते हैं.

पहले से मौजूद एआई एपीआई को इस तरह से डिज़ाइन किया गया है कि वे टास्क के लिए सही मॉडल के हिसाब से अनुमान लगा सकें. उदाहरण के लिए, Prompt API, किसी भाषा मॉडल के आधार पर अनुमान लगाता है. वहीं, Translator API, पहले से मौजूद किसी एक्सपर्ट मॉडल के आधार पर अनुमान लगाता है.

सर्वर-साइड एआई

सर्वर-साइड एआई में, क्लाउड-आधारित एआई सेवाएं शामिल होती हैं. मान लें कि Gemini 1.5 Pro, क्लाउड पर चल रहा है. ये मॉडल, काफ़ी बड़े और ज़्यादा असरदार होते हैं. यह बात खास तौर पर लार्ज लैंग्वेज मॉडल पर लागू होती है.

हाइब्रिड एआई

हाइब्रिड एआई का मतलब ऐसे किसी भी समाधान से है जिसमें क्लाइंट और सर्वर, दोनों कॉम्पोनेंट शामिल हों. उदाहरण के लिए:

  • क्लाइंट-साइड मॉडल, जो सर्वर-साइड मॉडल पर फ़ॉलबैक करते हैं. इन्हें उन कामों के लिए बनाया जाता है जिन्हें डिवाइस पर असरदार तरीके से पूरा नहीं किया जा सकता.
    • ऐसा हो सकता है कि डिवाइस पर ज़रूरी संसाधन उपलब्ध न हों.
    • मॉडल या एपीआई सिर्फ़ कुछ एनवायरमेंट में उपलब्ध है.
  • सुरक्षा के लिए, क्लाइंट और सर्वर के बीच मॉडल को बांटा जाता है.
    • उदाहरण के लिए, किसी मॉडल को इस तरह से बांटा जा सकता है कि 75% काम क्लाइंट पर हो और बाकी 25% सर्वर पर हो. इससे क्लाइंट-साइड के फ़ायदे मिलते हैं. साथ ही, मॉडल के कुछ हिस्से को डिवाइस से बाहर रखने की अनुमति मिलती है, ताकि वह निजी बना रहे.

Prompt API का इस्तेमाल करके, Firebase AI Logic के साथ हाइब्रिड आर्किटेक्चर सेट अप किया जा सकता है.

जनरेटिव एआई

जनरेटिव एआई, मशीन लर्निंग का एक फ़ॉर्म है. यह लोगों को ऐसा कॉन्टेंट बनाने में मदद करता है जो इंसानों के बनाए कॉन्टेंट जैसा लगता है. जनरेटिव एआई, भाषा मॉडल का इस्तेमाल करके डेटा को व्यवस्थित करता है. साथ ही, दिए गए कॉन्टेक्स्ट के आधार पर टेक्स्ट, इमेज, वीडियो, और ऑडियो बनाता है या उनमें बदलाव करता है. जनरेटिव एआई, पैटर्न मैच करने और अनुमान लगाने से आगे बढ़कर काम करता है.

लार्ज लैंग्वेज मॉडल (एलएलएम) में कई (अरबों तक) पैरामीटर होते हैं. इनका इस्तेमाल, कई तरह के टास्क करने के लिए किया जा सकता है. जैसे, टेक्स्ट या इमेज जनरेट करना, उन्हें कैटगरी में बांटना या उनकी खास जानकारी देना.

स्मॉल लैंग्वेज मॉडल (एसएलएम) में, एक जैसे टास्क पूरे करने के लिए काफ़ी कम पैरामीटर होते हैं. साथ ही, इसे क्लाइंट-साइड पर इस्तेमाल किया जा सकता है.

नैचुरल लैंग्वेज प्रोसेसिंग (एनएलपी)

नैचुरल लैंग्वेज प्रोसेसिंग, मशीन लर्निंग की एक क्लास है. इसका मकसद, कंप्यूटर को इंसानों की भाषा समझने में मदद करना है. इसमें किसी भाषा के नियमों से लेकर, लोगों की बोलचाल की भाषा, बोली, और स्लैंग शामिल हैं.

एजेंट या एआई एजेंट

एजेंट एक ऐसा सॉफ़्टवेयर होता है जो उपयोगकर्ता की ओर से किसी टास्क को पूरा करने के लिए, अपने-आप कार्रवाइयों की एक सीरीज़ का प्लान बनाता है और उसे लागू करता है. साथ ही, यह अपने एनवायरमेंट में होने वाले बदलावों के हिसाब से खुद को ढालता है. कार्रवाइयों में, एपीआई फ़ंक्शन या डेटाबेस क्वेरी शामिल हो सकती हैं. ये कार्रवाइयां, वेबपेज पर या तीसरे पक्ष के ऐप्लिकेशन के ज़रिए की जाती हैं. जैसे, Project Mariner.

चैटबॉट, एजेंट नहीं होता है. चैटबॉट, किसी मैसेंजर (चाहे वह इंसान हो या कोई और) को जवाब देता है. साथ ही, यह कॉन्टेंट जनरेट करने के लिए किसी मॉडल पर निर्भर होता है. जैसे, सवालों के जवाब. वहीं, एजेंट किसी टास्क को पूरा करने के लिए, टूल या डेटाबेस के साथ इंटरैक्ट करता है.

इनपुट और आउटपुट

मॉडल का इनपुट और आउटपुट अलग-अलग मोड में हो सकता है. जैसे, टेक्स्ट, इमेज, ऑडियो, और वीडियो. कोई मॉडल सिर्फ़ एक मोडेलिटी या कई मोडेलिटी (मल्टीमॉडल) स्वीकार कर सकता है. मॉडल चुनने से पहले, यह पक्का करना ज़रूरी है कि आपको किन मोडैलिटी की ज़रूरत है.

इनपुट और आउटपुट को स्ट्रीमिंग चंक या अनुरोध के आधार पर भेजा और पाया जा सकता है.

स्ट्रीमिंग

स्ट्रीमिंग की मदद से, भेजे या पाए गए किसी संसाधन को छोटे-छोटे हिस्सों में बांटा जाता है. इससे रीयल-टाइम में नतीजे मिलते हैं. इनपुट में बदलाव होने पर, आउटपुट में लगातार बदलाव होता रहता है.

यह ब्राउज़र के लिए, मीडिया ऐसेट पाने की एक सामान्य तकनीक है. जैसे, वीडियो बफ़र करना या इमेज को आंशिक रूप से लोड करना.

अनुरोध के आधार पर आउटपुट

अनुरोध के आधार पर आउटपुट जनरेट करने वाले मॉडल (या "नॉन-स्ट्रीमिंग" मॉडल) में, पूरे इनपुट के जनरेट होने का इंतज़ार किया जाता है. इसके बाद, पूरे इनपुट को एक साथ प्रोसेस किया जाता है और फिर आउटपुट जनरेट किया जाता है.

उदाहरण के लिए, चैट विंडो के संदर्भ में, उपयोगकर्ता के टाइप करते समय मॉडल जवाब जनरेट करने के बजाय, तब तक इंतज़ार करता है, जब तक उपयोगकर्ता 'भेजें' बटन पर क्लिक नहीं करता. मैसेज भेजने के बाद, मॉडल सभी इनपुट को ध्यान में रखता है और फिर जवाब देता है.

अन्य संसाधन

अगर आपने वेब पर एआई का इस्तेमाल पहली बार किया है, तो web.dev पर एआई से जुड़े संसाधनों का हमारा कलेक्शन देखें.