Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

पहले से मौजूद एआई की मदद से, भाषा की पहचान करने की सुविधा

Thomas Steiner

पब्लिश होने की तारीख: 24 सितंबर, 2024, पिछले अपडेट की तारीख: 20 मई, 2025

Browser Support

किसी भाषा के टेक्स्ट का दूसरी भाषा में अनुवाद करने से पहले, आपको यह तय करना होगा कि दिए गए टेक्स्ट में किस भाषा का इस्तेमाल किया गया है. पहले, अनुवाद के लिए टेक्स्ट को क्लाउड सेवा पर अपलोड करना पड़ता था. इसके बाद, सर्वर पर अनुवाद किया जाता था और फिर नतीजों को डाउनलोड किया जाता था.

Language Detector API, क्लाइंट-साइड पर काम करता है. इसका मतलब है कि उपयोगकर्ता की निजता को सुरक्षित रखा जा सकता है. हालांकि, ऐसा करने के लिए किसी खास लाइब्रेरी को शिप किया जा सकता है. हालांकि, इसे डाउनलोड करने के लिए अतिरिक्त संसाधनों की ज़रूरत होगी.

भाषा की पहचान करने की सुविधा का इस्तेमाल कब करना चाहिए

Language Detector API, मुख्य तौर पर इन स्थितियों में काम का होता है:

इनपुट टेक्स्ट की भाषा तय करना, ताकि उसका अनुवाद किया जा सके.
इनपुट टेक्स्ट की भाषा तय करना, ताकि भाषा के हिसाब से टास्क के लिए सही मॉडल लोड किया जा सके. जैसे, आपत्तिजनक कॉन्टेंट की पहचान करना.
इनपुट टेक्स्ट की भाषा तय करना, ताकि उसे सही तरीके से लेबल किया जा सके. जैसे, ऑनलाइन सोशल नेटवर्किंग साइटों पर.
इनपुट टेक्स्ट की भाषा तय करना, ताकि ऐप्लिकेशन के इंटरफ़ेस को उसके हिसाब से अडजस्ट किया जा सके. उदाहरण के लिए, बेल्जियम की किसी साइट पर, सिर्फ़ उन उपयोगकर्ताओं के लिए इंटरफ़ेस दिखाना जो फ़्रेंच भाषा बोलते हैं.

शुरू करें

Language Detector और Translator APIs, डेस्कटॉप पर Chrome में काम करते हैं. ये एपीआई, फ़ोन या टैबलेट पर काम नहीं करते.

यह देखने के लिए कि ब्राउज़र, Language Detector API के साथ काम करता है या नहीं, सुविधा की पहचान करने की प्रोसेस चलाएं.

if ('LanguageDetector' in self) {
  // The Language Detector API is available.
}

मॉडल डाउनलोड

भाषा की पहचान करने की सुविधा, एक मॉडल पर निर्भर करती है. इस मॉडल को, भाषाओं की पहचान करने के खास टास्क के लिए फ़ाइन-ट्यून किया जाता है. हालांकि, एपीआई ब्राउज़र में बनाया गया है, लेकिन मॉडल को ऑन-डिमांड डाउनलोड किया जाता है. ऐसा तब होता है, जब कोई साइट पहली बार एपीआई का इस्तेमाल करने की कोशिश करती है. Chrome में, यह मॉडल अन्य मॉडल की तुलना में बहुत छोटा होता है. यह मॉडल पहले से मौजूद हो सकता है, क्योंकि इसका इस्तेमाल Chrome की अन्य सुविधाओं में भी किया जाता है.

यह तय करने के लिए कि मॉडल इस्तेमाल के लिए तैयार है या नहीं, एसिंक्रोनस LanguageDetector.availability() फ़ंक्शन को कॉल करें. अगर availability() के जवाब में downloadable मिला है, तो डाउनलोड की प्रोसेस पर नज़र रखें और उपयोगकर्ता को इसकी जानकारी दें, क्योंकि डाउनलोड होने में समय लग सकता है.

डाउनलोड शुरू करने और भाषा की पहचान करने की सुविधा को इंस्टैंशिएट करने के लिए, उपयोगकर्ता के ऐक्टिवेशन की जांच करें. इसके बाद, एसिंक्रोनस LanguageDetector.create() फ़ंक्शन को कॉल करें.

const detector = await LanguageDetector.create({
  monitor(m) {
    m.addEventListener('downloadprogress', (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});

भाषा की पहचान करने की सुविधा का इस्तेमाल करना

Language Detector API, यह तय करने के लिए रैंकिंग मॉडल का इस्तेमाल करता है कि दिए गए टेक्स्ट में किस भाषा का इस्तेमाल किया गया है. रैंकिंग, मशीन लर्निंग का एक टाइप है. इसका मकसद, आइटम की सूची को क्रम में लगाना है. इस मामले में, Language Detector API, भाषाओं को सबसे ज़्यादा से लेकर सबसे कम संभावना के क्रम में रैंक करता है.

detect() फ़ंक्शन, पहला नतीजा, सबसे संभावित जवाब या कॉन्फ़िडेंस लेवल के साथ रैंक किए गए कैंडिडेट पर इटरेट कर सकता है. यह {detectedLanguage, confidence} ऑब्जेक्ट की सूची के तौर पर दिखता है. confidence लेवल को 0.0 (सबसे कम कॉन्फ़िडेंस) और 1.0 (सबसे ज़्यादा कॉन्फ़िडेंस) के बीच की वैल्यू के तौर पर दिखाया जाता है.

const someUserText = 'Hallo und herzlich willkommen!';
const results = await detector.detect(someUserText);
for (const result of results) {
  // Show the full list of potential languages with their likelihood, ranked
  // from most likely to least likely. In practice, one would pick the top
  // language(s) that cross a high enough threshold.
  console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...

चेतावनी: बहुत छोटे वाक्यांशों और एक-एक शब्दों का इस्तेमाल करने से बचें, क्योंकि नतीजों की सटीकता कम होगी. अगर आम तौर पर छोटे टेक्स्ट के साथ काम किया जाता है, तो अपनी प्राथमिकता वाली भाषाओं के साथ एक्सपेरिमेंट करें, रिपोर्ट किए गए कॉन्फ़िडेंस की समीक्षा करें, और जब कॉन्फ़िडेंस बहुत कम हो, तो नतीजे को 'मालूम नहीं' के तौर पर दिखाएं.

एपीआई प्लेग्राउंड

हमारे एपीआई प्लेग्राउंड में, Language Detector API के साथ एक्सपेरिमेंट करें. टेक्स्ट एरिया में, अलग-अलग भाषाओं में लिखा गया टेक्स्ट डालें.

अनुमति की नीति, iframe, और वेब वर्कर

डिफ़ॉल्ट रूप से, Language Detector API सिर्फ़ टॉप-लेवल विंडो और उनके सेम-ऑरिजिन iframe के लिए उपलब्ध होता है. Permission Policy allow="" एट्रिब्यूट का इस्तेमाल करके, क्रॉस-ऑरिजिन iframe को एपीआई का ऐक्सेस दिया जा सकता है:

<!--
  The hosting site at https://main.example.com can grant a cross-origin iframe
  at https://cross-origin.example.com/ access to the Language Detector API by
  setting the `allow="language-detector"` attribute.
-->
<iframe src="https://cross-origin.example.com/" allow="language-detector"></iframe>

Language Detector API, वेब वर्कर में उपलब्ध नहीं है. ऐसा इसलिए है, क्योंकि Permissions Policy की स्थिति की जांच करने के लिए, हर वर्कर के लिए ज़िम्मेदार दस्तावेज़ बनाना मुश्किल होता है.

सुझाव/राय दें या शिकायत करें

हमें यह देखने में दिलचस्पी है कि Language Detector API का इस्तेमाल करके, क्या बनाया जा रहा है. अपनी वेबसाइटें और वेब ऐप्लिकेशन, X, YouTube, और LinkedIn पर हमारे साथ शेयर करें.

अगर Chrome के लागू करने के तरीके के बारे में कोई सुझाव, शिकायत या राय है, तो Chromium में गड़बड़ी की शिकायत करें.

एआई के नए एपीआई को सबसे पहले देखने के लिए, Early Preview Program में शामिल हों. साथ ही, हमारी मेलिंग सूची में शामिल होकर, चर्चा में हिस्सा लें.