पब्लिश होने की तारीख: 24 सितंबर, 2024, पिछले अपडेट की तारीख: 20 मई, 2025
किसी भाषा के टेक्स्ट का दूसरी भाषा में अनुवाद करने से पहले, आपको यह तय करना होगा कि दिए गए टेक्स्ट में किस भाषा का इस्तेमाल किया गया है. पहले, अनुवाद के लिए टेक्स्ट को क्लाउड सेवा पर अपलोड करना पड़ता था. इसके बाद, सर्वर पर अनुवाद किया जाता था और फिर नतीजों को डाउनलोड किया जाता था.
Language Detector API, क्लाइंट-साइड पर काम करता है. इसका मतलब है कि उपयोगकर्ता की निजता को सुरक्षित रखा जा सकता है. हालांकि, ऐसा करने के लिए किसी खास लाइब्रेरी को शिप किया जा सकता है. हालांकि, इसे डाउनलोड करने के लिए अतिरिक्त संसाधनों की ज़रूरत होगी.
भाषा की पहचान करने की सुविधा का इस्तेमाल कब करना चाहिए
Language Detector API, मुख्य तौर पर इन स्थितियों में काम का होता है:
- इनपुट टेक्स्ट की भाषा तय करना, ताकि उसका अनुवाद किया जा सके.
- इनपुट टेक्स्ट की भाषा तय करना, ताकि भाषा के हिसाब से टास्क के लिए सही मॉडल लोड किया जा सके. जैसे, आपत्तिजनक कॉन्टेंट की पहचान करना.
- इनपुट टेक्स्ट की भाषा तय करना, ताकि उसे सही तरीके से लेबल किया जा सके. जैसे, ऑनलाइन सोशल नेटवर्किंग साइटों पर.
- इनपुट टेक्स्ट की भाषा तय करना, ताकि ऐप्लिकेशन के इंटरफ़ेस को उसके हिसाब से अडजस्ट किया जा सके. उदाहरण के लिए, बेल्जियम की किसी साइट पर, सिर्फ़ उन उपयोगकर्ताओं के लिए इंटरफ़ेस दिखाना जो फ़्रेंच भाषा बोलते हैं.
शुरू करें
Language Detector और Translator APIs, डेस्कटॉप पर Chrome में काम करते हैं. ये एपीआई, फ़ोन या टैबलेट पर काम नहीं करते.
यह देखने के लिए कि ब्राउज़र, Language Detector API के साथ काम करता है या नहीं, सुविधा की पहचान करने की प्रोसेस चलाएं.
if ('LanguageDetector' in self) {
// The Language Detector API is available.
}
मॉडल डाउनलोड
भाषा की पहचान करने की सुविधा, एक मॉडल पर निर्भर करती है. इस मॉडल को, भाषाओं की पहचान करने के खास टास्क के लिए फ़ाइन-ट्यून किया जाता है. हालांकि, एपीआई ब्राउज़र में बनाया गया है, लेकिन मॉडल को ऑन-डिमांड डाउनलोड किया जाता है. ऐसा तब होता है, जब कोई साइट पहली बार एपीआई का इस्तेमाल करने की कोशिश करती है. Chrome में, यह मॉडल अन्य मॉडल की तुलना में बहुत छोटा होता है. यह मॉडल पहले से मौजूद हो सकता है, क्योंकि इसका इस्तेमाल Chrome की अन्य सुविधाओं में भी किया जाता है.
यह तय करने के लिए कि मॉडल इस्तेमाल के लिए तैयार है या नहीं, एसिंक्रोनस
LanguageDetector.availability()
फ़ंक्शन को कॉल करें. अगर availability() के जवाब में downloadable मिला है, तो डाउनलोड की प्रोसेस पर नज़र रखें और उपयोगकर्ता को इसकी जानकारी दें, क्योंकि डाउनलोड होने में समय लग सकता है.
डाउनलोड शुरू करने और भाषा की पहचान करने की सुविधा को इंस्टैंशिएट करने के लिए, उपयोगकर्ता के ऐक्टिवेशन की जांच करें. इसके बाद, एसिंक्रोनस LanguageDetector.create() फ़ंक्शन को कॉल करें.
const detector = await LanguageDetector.create({
monitor(m) {
m.addEventListener('downloadprogress', (e) => {
console.log(`Downloaded ${e.loaded * 100}%`);
});
},
});
भाषा की पहचान करने की सुविधा का इस्तेमाल करना
Language Detector API, यह तय करने के लिए रैंकिंग मॉडल का इस्तेमाल करता है कि दिए गए टेक्स्ट में किस भाषा का इस्तेमाल किया गया है. रैंकिंग, मशीन लर्निंग का एक टाइप है. इसका मकसद, आइटम की सूची को क्रम में लगाना है. इस मामले में, Language Detector API, भाषाओं को सबसे ज़्यादा से लेकर सबसे कम संभावना के क्रम में रैंक करता है.
detect() फ़ंक्शन, पहला नतीजा, सबसे संभावित जवाब या कॉन्फ़िडेंस लेवल के साथ रैंक किए गए कैंडिडेट पर इटरेट कर सकता है.
यह {detectedLanguage, confidence} ऑब्जेक्ट की सूची के तौर पर दिखता है. confidence लेवल को 0.0 (सबसे कम कॉन्फ़िडेंस) और 1.0 (सबसे ज़्यादा कॉन्फ़िडेंस) के बीच की वैल्यू के तौर पर दिखाया जाता है.
const someUserText = 'Hallo und herzlich willkommen!';
const results = await detector.detect(someUserText);
for (const result of results) {
// Show the full list of potential languages with their likelihood, ranked
// from most likely to least likely. In practice, one would pick the top
// language(s) that cross a high enough threshold.
console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...
एपीआई प्लेग्राउंड
हमारे एपीआई प्लेग्राउंड में, Language Detector API के साथ एक्सपेरिमेंट करें. टेक्स्ट एरिया में, अलग-अलग भाषाओं में लिखा गया टेक्स्ट डालें.
अनुमति की नीति, iframe, और वेब वर्कर
डिफ़ॉल्ट रूप से, Language Detector API सिर्फ़ टॉप-लेवल विंडो और उनके सेम-ऑरिजिन iframe के लिए उपलब्ध होता है. Permission Policy allow="" एट्रिब्यूट का इस्तेमाल करके, क्रॉस-ऑरिजिन iframe को एपीआई का ऐक्सेस दिया जा सकता है:
<!--
The hosting site at https://main.example.com can grant a cross-origin iframe
at https://cross-origin.example.com/ access to the Language Detector API by
setting the `allow="language-detector"` attribute.
-->
<iframe src="https://cross-origin.example.com/" allow="language-detector"></iframe>
Language Detector API, वेब वर्कर में उपलब्ध नहीं है. ऐसा इसलिए है, क्योंकि Permissions Policy की स्थिति की जांच करने के लिए, हर वर्कर के लिए ज़िम्मेदार दस्तावेज़ बनाना मुश्किल होता है.
सुझाव/राय दें या शिकायत करें
हमें यह देखने में दिलचस्पी है कि Language Detector API का इस्तेमाल करके, क्या बनाया जा रहा है. अपनी वेबसाइटें और वेब ऐप्लिकेशन, X, YouTube, और LinkedIn पर हमारे साथ शेयर करें.
अगर Chrome के लागू करने के तरीके के बारे में कोई सुझाव, शिकायत या राय है, तो Chromium में गड़बड़ी की शिकायत करें.
एआई के नए एपीआई को सबसे पहले देखने के लिए, Early Preview Program में शामिल हों. साथ ही, हमारी मेलिंग सूची में शामिल होकर, चर्चा में हिस्सा लें.