'एआई का इस्तेमाल करके काम करने की सुविधा' वर्कशॉप की हाइलाइट

Damani Brown
Damani Brown
Melissa Mitchell
Melissa Mitchell
Mari Viana
Mari Viana

पब्लिश होने की तारीख: 14 अक्टूबर, 2025

हमने न्यूयॉर्क शहर में स्टार्टअप के एक ग्रुप के साथ मिलकर, "एआई इन ऐक्शन" टेक्निकल वर्कशॉप को होस्ट किया. इसका मकसद यह दिखाना था कि क्लाइंट-साइड एआई और बिल्ट-इन एआई एपीआई को सीधे तौर पर उनके प्रॉडक्ट में कैसे इंटिग्रेट किया जा सकता है. इससे, बेहतर स्पीड, निजता, और उपयोगकर्ता अनुभव मिलता है.

हमने कुल 24 डेवलपर को होस्ट किया. ये डेवलपर, आठ नई सोच वाली स्टार्टअप कंपनियों से थे. सुबह के सेशन में, प्रॉडक्ट और इंजीनियरिंग के विशेषज्ञों ने बातचीत की. इसमें ओपन सोर्स, डिवाइस पर मौजूद मॉडल की अपार संभावनाओं के बारे में बताया गया. साथ ही, एआई को सीधे तौर पर वेब प्लैटफ़ॉर्म पर लाने के रणनीतिक महत्व के बारे में भी बताया गया. इसके बाद, तकनीकी विशेषज्ञों ने बिल्ट-इन एआई एपीआई का इस्तेमाल शुरू करने के लिए, व्यावहारिक सुझाव दिए.

मीटिंग में शामिल होने वाले लोगों को यह इवेंट बहुत काम का लगा. उन्हें पता चला कि मशीन लर्निंग के बारे में पहले से जानकारी न होने के बावजूद, इन एपीआई का इस्तेमाल करना आसान है. उन्होंने एक्सपेरिमेंट के ज़रिए, अपने ऐप्लिकेशन के इस्तेमाल के नए उदाहरण भी खोजे. हमें अपने दस्तावेज़ों की पुष्टि करने में बहुत खुशी हुई. एक ग्रुप ने हमें एक जटिल गड़बड़ी की पहचान करने और उसे ठीक करने में मदद की, ताकि हम उसे ठीक करने के लिए सबमिट कर सकें.

सम्मेलन में शामिल लोगों ने क्लाइंट-साइड एआई का इस्तेमाल करके, 10 प्रोटोटाइप बनाए. उनके कुछ प्रोजेक्ट देखें और इवेंट में उनके अनुभव के बारे में जानें.

Prompt API का इस्तेमाल करके, अडैप्टर के इवेंट का पता लगाना

Adapter का लक्ष्य, "हमारी रोज़मर्रा की ज़िंदगी के लिए मिशन कंट्रोल बनाना है, ताकि स्क्रीन पर कम समय बिताया जाए और ज़्यादा से ज़्यादा समय खाली रहे." उन्होंने दो सुविधाओं वाला एक कॉन्सेप्ट एक्सटेंशन बनाया:

  • इंटेलिजेंट और अलाइन इवेंट डिटेक्शन की सुविधा, वेब पेज ब्राउज़ करते समय इवेंट (कॉन्सर्ट, रेस्टोरेंट, इवेंट) का पता लगाती है. इसके बाद, यह सुविधा इवेंट को निजी कॉन्टेक्स्ट के हिसाब से ढालती है. जैसे, निजी कैलेंडर की उपलब्धता, जीवन से जुड़ी प्राथमिकताएं, और रीयल-टाइम सोशल सिग्नल. इन सभी को स्थानीय तौर पर प्रोसेस किया जाता है.
  • कॉन्टेंट को रीयल-टाइम में फिर से रैंक करने की सुविधा. इससे वेब पेज पर मौजूद कॉन्टेंट को आपकी निजी दिलचस्पी के हिसाब से क्रम में लगाया जाता है.

अडैप्टर ने पार्स करने, तर्क करने, और टूल को कॉल करने के लिए, Prompt API का इस्तेमाल किया. साथ ही, स्थानीय टेक्स्ट जनरेट करने के लिए, Writer API का इस्तेमाल किया.

"हम निजता से जुड़े समझौते को सीमित रखते हुए, एज पर कई चरणों में काम करने वाले वर्कफ़्लो और जटिल रीज़निंग कर रहे हैं. इससे निजी इंटेलिजेंस ऐप्लिकेशन चालू हो जाते हैं. पहले, हर अनुमान का मतलब था कि डेटा को नेटवर्क पर शिप किया जाए. साथ ही, रिमोट कंप्यूटेशन को बेहतर बनाया जाए." – डिलन पोंज़ो, Adapter के फ़ाउंडिंग इंजीनियर

Chrome में पहले से मौजूद एआई एपीआई, हल्के मॉडल को चालू करते हैं. ये मॉडल, डेटा को स्थानीय तौर पर प्रोसेस करते हैं. साथ ही, डिफ़ॉल्ट रूप से निजता बनाए रखते हैं. Adapter के फ़ाउंडिंग इंजीनियर Aidan Crank और Dillon Ponzo ने इसे अपनी आर्किटेक्चरल फ़िलॉसफ़ी की पुष्टि के तौर पर देखा.

क्रैंक बताते हैं कि "ज़्यादातर एआई एक्सटेंशन, कॉन्टेक्स्ट को कैप्चर करते हैं और उसे कहीं और भेजते हैं." क्रैंक ने Adapter में शामिल होने से पहले, AWS में बड़े पैमाने पर एमएल इंजीनियरिंग पर काम किया था. "Chrome में पहले से मौजूद एआई, उस मॉडल को उलट देता है. आपका निजी डेटा आपके डिवाइस पर ही रहता है. हालांकि, आपको पहले से ज़्यादा बेहतर अनुभव मिलता है."

Adapter के सह-संस्थापक एडम गेट्टी का मानना है कि निजता की सुरक्षा के लिए, डेटा को सुरक्षित रखने के तरीके को बड़े पैमाने पर लागू करना ज़रूरी है. उनकी पिछली कंपनी Ionic Security ने इस दिशा में काफ़ी काम किया है. उनका कहना है कि "निजता कोई ऐसी सुविधा नहीं है जिसे जोड़ा जा सकता है. यह एक ऐसा आर्किटेक्चर है जिसे चुना जाता है. Chrome में पहले से मौजूद एआई की वजह से, यह आर्किटेक्चर काम कर पाता है."

Chrome, मल्टीमॉडल सपोर्ट और बेहतर एपीआई के साथ इन सुविधाओं को बेहतर बना रहा है. इसलिए, एज सिर्फ़ क्लाउड के साथ तालमेल नहीं बिठा रहा है. निजी और प्राइवेट एआई के लिए, यह ज़रूरी है कि एआई को उन मामलों में बेहतर बनाया जाए जहां इसकी ज़रूरत है.

सबलेयर, प्रॉम्प्ट एपीआई की मदद से इमेज को कैटगरी में बांटता है, ताकि अलग-अलग तरह की इमेज को बेहतर बनाया जा सके

Sublayer ने Photoslider नाम का एक मज़ेदार ऐप्लिकेशन बनाया है. इसे इस तरह से डिज़ाइन किया गया है कि आप अपनी इमेज के साथ इंटरैक्ट करने और उनके अलग-अलग वर्शन जनरेट करने के तरीके में बदलाव कर सकें.

PhotoSlider का इस्तेमाल करने के लिए, उपयोगकर्ता कोई फ़ोटो अपलोड करता है या नई फ़ोटो कैप्चर करता है. इसके बाद, वह विश्लेषण करें पर क्लिक करता है. Prompt API, इन इमेज को विश्लेषण के लिए मॉडल को भेजता है. साथ ही, मॉडल से तीन मुख्य एट्रिब्यूट की पहचान करने और उन्हें 1 से 10 तक की वैल्यू देने का अनुरोध करता है. उदाहरण के लिए, कोई एट्रिब्यूट "पारंपरिक" या "चमक" हो सकता है.

फ़्रंटएंड पर, उपयोगकर्ता को इमेज और स्लाइडर दिखाए जाते हैं. इनकी मदद से, वह वैल्यू में बदलाव कर सकता है या कस्टम वैल्यू वाले नए एट्रिब्यूट जोड़ सकता है. बदलाव करने के अनुरोध और इमेज को सर्वर-साइड एआई को भेजा जाता है, ताकि मल्टीमॉडल आउटपुट की सुविधाओं वाला बड़ा मॉडल, बदली गई खास बातों के आधार पर बिलकुल नई इमेज जनरेट कर सके. इस प्रोसेस को बार-बार दोहराया जा सकता है. इससे आपको अपनी पसंद के मुताबिक इमेज मिलने तक, पूरा कंट्रोल मिलता है.

Sublayer के सीईओ, स्कॉट वर्नर ने इस बारे में कहा, "हमें यह जानने में दिलचस्पी थी कि लोकल इन्फ़रेंस कैसा दिखता है. इसे डिफ़ॉल्ट रूप से, हमारे उपयोगकर्ताओं के ब्राउज़र में उपलब्ध कराना, सीधे तौर पर मॉडल इंस्टॉल करने की जटिलताओं को नेविगेट करने के लिए उपयोगकर्ताओं पर भरोसा करने की तुलना में बहुत आसान है."

Echo3D, 3D मॉडल को खोजे जा सकने वाले ज़्यादा बेहतर डेटा में बदलता है

Echo3D, कंपनियों को एक प्लैटफ़ॉर्म और एपीआई उपलब्ध कराता है. इसकी मदद से, कंपनियां अलग-अलग टीमों और संगठनों के साथ 3D मॉडल और स्कैन को आसानी से सेव, सुरक्षित, और शेयर कर सकती हैं. इनकी बेहतर 3D और टेक्स्ट पाइपलाइन, 3D मॉडल को खोजे जा सकने वाले डेटा में बदल देती हैं.

इस इवेंट में, echo3D ने 3D से टेक्स्ट और टेक्स्ट से 3D में बदलने वाले टूल बनाए. इनसे ऐसेट को विज़ुअल तौर पर समझने में मदद मिलती है. उन्होंने Prompt API का इस्तेमाल करके, मॉडल टैग करने की प्रोसेस को अपने-आप होने के लिए सेट किया. साथ ही, डुप्लीकेट मॉडल का पता लगाया. इसके अलावा, उन्होंने 3D मॉडल की बड़ी लाइब्रेरी की कैटलॉगिंग और दस्तावेज़ बनाने की प्रोसेस को आसान बनाया.

{
  "description": "A 3D model of a large, tan-colored sandcastle with one main
    tower, four small towers, and staircases wrapping around. The towers
    have multiple windows. There is a main gate.",
  "tags": ["sand","castle","gate","tan","tower","staircase"]
}

इससे हर ऐसेट को बेहतर, एक जैसी, और खोजे जा सकने वाली जानकारी मिलती है. इस तरह, उपयोगकर्ता की पूरी लाइब्रेरी ज़्यादा व्यवस्थित और ऐक्सेस करने में आसान हो जाती है. इसके अलावा, इससे स्टोरेज की जगह बचती है और एक जैसी फ़ाइलों की वजह से वर्शन में होने वाले टकराव को रोका जा सकता है.

"हमारी टीम को यह इवेंट बहुत पसंद आया. हम खास तौर पर इस बात से काफ़ी प्रभावित हुए कि एआई की सुविधाओं को, वेब ऐप्लिकेशन में आसानी से इंटिग्रेट किया जा सकता है. इसके लिए, एआई की सुविधाओं को वेब ऐप्लिकेशन में पहले से ही शामिल किया जाता है. इतने कम समय में, सुरक्षित और क्लाइंट-साइड एआई सुविधाओं का प्रोटोटाइप बनाने और उन्हें डिप्लॉय करने की क्षमता, हमारे लिए काफ़ी फ़ायदेमंद साबित हुई." – एलन ग्रिनस्पून, सीईओ, echo3D

Spot2 ने अपलोड की गई इमेज से स्ट्रक्चर्ड मेटाडेटा बनाया

Spot2 के ऐप्लिकेशन में, मेक्सिको सिटी में किराए पर उपलब्ध रीयल एस्टेट प्रॉपर्टी की सूची दी गई है. अक्सर इन प्रॉपर्टी को लिस्ट करते समय, लिस्टिंग में ज़रूरी मेटाडेटा और अन्य अहम जानकारी मौजूद नहीं होती. यह जानकारी अलग-अलग हो सकती है. यह इस बात पर निर्भर करती है कि सप्लायर ने कितनी बारीकी से जानकारी दी है. Spot2 ने Prompt API की मदद से, डेटा क्वालिटी को बेहतर बनाने में पूरा दिन बिताया.

उनकी टीम ने एक ऐसी सुविधा डेवलप की है जो लिस्टिंग के मेटाडेटा को अपने-आप प्रोसेस करती है और उसे व्यवस्थित करती है. यह प्रोसेस, फ़ोटो अपलोड होते ही शुरू हो जाती है. इससे फ़ोटो में पूरी जानकारी और एक जैसी क्वालिटी बनी रहती है. इस टास्क को सर्वर-साइड के बजाय क्लाइंट-साइड पर करने से, इस सुविधा का इस्तेमाल कम खर्च में किया जा सकता है.

इस सुविधा को लॉन्च करने से, दो तरह के फ़ायदे मिलेंगे: डेटा की क्वालिटी में काफ़ी सुधार होगा और ऑपरेशनल खर्च में भी कमी आएगी. "हमें उम्मीद है कि बेहतर क्वालिटी वाली लिस्टिंग से कन्वर्ज़न रेट भी बढ़ेगा."

अगली बार हमसे जुड़ें