इस सेक्शन में बताया गया है कि CrUX, उपयोगकर्ता अनुभव से जुड़े डेटा को कैसे इकट्ठा और व्यवस्थित करता है.
ज़रूरी शर्तें
CrUX डेटासेट में मुख्य तौर पर लोगों के अनुभव को ध्यान में रखा जाता है. उपयोगकर्ताओं की संख्या को पेज-लेवल और ऑरिजिन-लेवल पर डिस्ट्रिब्यूशन के हिसाब से एग्रीगेट किया जाता है. इस सेक्शन में, उपयोगकर्ता की ज़रूरी शर्तों के बारे में बताया गया है. साथ ही, डेटासेट में शामिल किए जाने वाले पेजों और ऑरिजिन से जुड़ी ज़रूरी शर्तों के बारे में भी बताया गया है. PageSpeed Insights और CrUX API में उपलब्ध पेज-लेवल के डेटा में अनुभव को शामिल करने के लिए, सभी ज़रूरी शर्तों को पूरा करना ज़रूरी है: उपयोगकर्ता, ऑरिजिन, और पेज. ऐसे अनुभव जो उपयोगकर्ता और ऑरिजिन से जुड़ी शर्तों को पूरा करते हैं लेकिन पेज को नहीं, उन्हें सभी CrUX डेटा सोर्स में उपलब्ध ऑरिजिन-लेवल के डेटा में शामिल किया जाता है.
अगर पेज और ऑरिजिन की शर्तों में समय के साथ बदलाव होता है, तो उन्हें डेटासेट में अपने-आप शामिल कर दिया जाता है या हटा दिया जाता है. फ़िलहाल, पेजों या ऑरिजिन को मैन्युअल तौर पर शामिल करने के लिए सबमिट नहीं किया जा सकता.
सार्वजनिक रूप से खोजे जाने लायक
यह ज़रूरी है कि किसी पेज को सार्वजनिक तौर पर खोजा जा सके, ताकि उसे CrUX डेटासेट में शामिल किया जा सके.
सर्च इंजन की इंडेक्स होने की क्षमता की शर्तों का इस्तेमाल करके, पेज को सार्वजनिक तौर पर खोजे जाने लायक बनाया जाता है.
अगर ऑरिजिन डेटासेट के रूट पेजों के साथ-साथ यहां दी गई कोई भी शर्त पूरी होती है, तो पेज खोजे जाने से जुड़ी ज़रूरी शर्तों को पूरा नहीं कर सकता:
- इस पेज को
200
(रीडायरेक्ट के बाद) के अलावा, कोई दूसरा एचटीटीपी स्टेटस कोड दिखाया जाता है. - पेज को एचटीटीपी
X-Robots-Tag: noindex
हेडर या इसके बराबर की चीज़ के साथ दिखाया जाता है. - दस्तावेज़ में
<meta name="robots" content="noindex">
मेटा टैग या इससे मिलता-जुलता टैग शामिल है.
अपनी साइट के इंडेक्स होने की स्थिति की खास जानकारी के लिए, Google Search Console पर जाएं.
काफ़ी लोकप्रिय
किसी पेज को तभी ज़रूरत के मुताबिक लोकप्रिय माना जाता है, जब उस पेज पर आने वाले लोगों की संख्या कम से कम हो. किसी ऑरिजिन को तब ज़रूरत के मुताबिक लोकप्रिय माना जाता है, जब उसके सभी पेजों पर आने वाले लोगों की संख्या कम से कम हो. सटीक संख्या ज़ाहिर नहीं की जाती, लेकिन इसे इसलिए चुना गया है, ताकि यह पक्का किया जा सके कि हमारे पास शामिल किए गए पेजों के आंकड़ों के डिस्ट्रिब्यूशन को बेहतर बनाने के लिए ज़रूरी सैंपल मौजूद हों. पेजों और ऑरिजिन के लिए कम से कम संख्या एक ही होती है.
ऐसे पेज और ऑरिजिन जो लोकप्रियता के थ्रेशोल्ड को पूरा नहीं करते, उन्हें CrUX डेटासेट में शामिल नहीं किया जाता.
शुरुआत की जगह
ऑरिजिन ऐसी पूरी वेबसाइट को दिखाता है जिसे https://www.example.com
जैसे यूआरएल से पता किया जा सकता है. किसी ऑरिजिन को CrUX डेटासेट में शामिल करने के लिए, दो ज़रूरी शर्तें पूरी करनी होंगी:
Lighthouse ऑडिट चलाकर और एसईओ कैटगरी के नतीजे देखकर, इस बात की पुष्टि की जा सकती है कि आपकी साइट के ऑरिजिन को खोजा जा सकता है. अगर आपका रूट पेज काम नहीं करता, तो आपकी साइट को नहीं खोजा जा सकता:पेज को इंडेक्स करने से ब्लॉक किया गया है या पेज का एचटीटीपी स्टेटस कोड काम नहीं कर रहा है ऑडिट.
अगर ऑरिजिन को सार्वजनिक तौर पर खोजे जाने लायक माना जाता है, तो उस ऑरिजिन के सभी पेजों पर ज़रूरी शर्तें पूरी करने वाले उपयोगकर्ता अनुभव को ऑरिजिन-लेवल पर एग्रीगेट किया जाता है. इससे कोई फ़र्क़ नहीं पड़ता है कि उस ऑरिजिन को अलग-अलग पेज पर खोजा जा सकता है या नहीं. ये सभी अनुभव, ऑरिजिन की लोकप्रियता से जुड़ी ज़रूरी शर्तों को पूरा करते हैं.
क्वेरी करने के मकसद से, ध्यान रखें कि CrUX डेटासेट में सभी ऑरिजिन लोअरकेस में होते हैं.
पेज
CrUX डेटासेट में शामिल किए जाने वाले पेज की ज़रूरी शर्तें, ऑरिजिन की तरह ही होती हैं:
Lighthouse ऑडिट किया जा सकता है और एसईओ कैटगरी के नतीजे देखकर इस बात की पुष्टि की जा सकती है कि कोई पेज खोजे जा सकता है. अगर आपका पेज पेज को इंडेक्स करने से ब्लॉक कर दिया गया है या पेज को इंडेक्स नहीं किया जा सका है, तो उसे नहीं खोजा जा सकता.
अगर कुछ लोगों के लिए पेज को सार्वजनिक तौर पर खोजा जा सकता है, लेकिन कुछ मामलों में वह एचटीटीपी स्टेटस दिखाता है, तो उन अनुभवों को CrUX में शामिल नहीं किया जाएगा.
आम तौर पर, पेजों के यूआरएल में अतिरिक्त आइडेंटिफ़ायर होते हैं. इनमें क्वेरी स्ट्रिंग पैरामीटर ?utm_medium=email
और #main
जैसे फ़्रैगमेंट शामिल होते हैं. इन आइडेंटिफ़ायर को CrUX डेटासेट में मौजूद यूआरएल से हटा दिया जाता है, ताकि पेज पर मौजूद सभी उपयोगकर्ता अनुभव एक साथ दिख सकें. यह उन पेजों के लिए फ़ायदेमंद है जो एक ही पेज के लिए अलग-अलग यूआरएल वैरिएशन होने पर, लोकप्रियता के थ्रेशोल्ड को पूरा नहीं करते. ध्यान दें कि ऐसा बहुत कम मामलों में हो सकता है कि इसकी वजह से अलग-अलग पेजों के अनुभवों को एक साथ ग्रुप किया जाए. उदाहरण के लिए, अगर पैरामीटर ?productID=101
और ?productID=102
अलग-अलग पेजों को दिखाते हैं.
CrUX में पेजों को, टॉप लेवल पेज के आधार पर मापा जाता है. CrUX में, iframe के तौर पर शामिल किए गए पेजों की रिपोर्ट अलग से नहीं की जाती है. हालांकि, ये टॉप लेवल पेज की मेट्रिक पर असर डालते हैं. उदाहरण के लिए, अगर https://www.example.com/page.html
, https://www.example.com/frame.html
को iframe में एम्बेड करता है, तो page.html
CrUX में दिखेगा. हालांकि, यह दूसरी ज़रूरी शर्तों पर निर्भर करेगा, लेकिन frame.html
नहीं दिखेगा. अगर frame.html
का सीएलएस खराब है, तो page.html
के लिए सीएलएस को मेज़र करते समय, सीएलएस को शामिल किया जाएगा. CrUX, Chrome की उपयोगकर्ता अनुभव रिपोर्ट है और हो सकता है कि उपयोगकर्ता को पता ही न हो कि यह एक iframe है. इसलिए, टॉप लेवल पेज पर अनुभव को इस हिसाब से मेज़र किया जाता है कि उपयोगकर्ता को यह कैसा दिखता है.
CrUX में, किसी वेबसाइट का डेटा दिखाने के तरीके को समझना मुश्किल हो सकता है. उदाहरण के लिए, एक पेज वाले ऐप्लिकेशन (एसपीए), एक पेज से दूसरे पेज पर जाने के लिए JavaScript पर आधारित रूट ट्रांज़िशन स्कीम का इस्तेमाल कर सकते हैं. पारंपरिक ऐंकर पर आधारित पेज नेविगेशन के बजाय, एक पेज से दूसरे पेज पर जाने के लिए ऐसा किया जाता है. ये ट्रांज़िशन, उपयोगकर्ता को नए पेज व्यू के तौर पर दिखते हैं. हालांकि, Chrome और मौजूदा प्लैटफ़ॉर्म एपीआई के लिए, शुरुआती पेज व्यू को पूरा अनुभव माना जाता है. यह उन वेब प्लैटफ़ॉर्म एपीआई की सीमा है जिन पर CrUX बनाया गया है. ज़्यादा जानकारी के लिए, web.dev पर देखें कि एसपीए आर्किटेक्चर, वेबसाइट की परफ़ॉर्मेंस की अहम जानकारी पर कैसे असर डालते हैं.
उपयोगकर्ता
किसी उपयोगकर्ता के अनुभव को CrUX डेटासेट में इकट्ठा करने के लिए, उसे इन शर्तों को पूरा करना होगा:
- इस्तेमाल के आंकड़ों की रिपोर्टिंग चालू करें.
- उसका ब्राउज़र इतिहास सिंक करें.
- सिंक करने के लिए लंबा पासवर्ड सेट न हो.
- जिस प्लैटफ़ॉर्म पर यह सुविधा काम करती है उसका इस्तेमाल करें.
फ़िलहाल, इन प्लैटफ़ॉर्म का इस्तेमाल किया जा सकता है:
- Chrome के डेस्कटॉप वर्शन, जिनमें Windows, macOS, ChromeOS, और Linux ऑपरेटिंग सिस्टम शामिल हैं.
- Chrome के Android वर्शन, जिनमें कस्टम टैब और WebAPKs का इस्तेमाल करने वाले मोबाइल ऐप्लिकेशन भी शामिल हैं.
यहां कुछ खास अपवाद दिए गए हैं, जो CrUX डेटासेट को डेटा नहीं देते हैं:
- iOS पर Chrome.
- वेबव्यू का इस्तेमाल करने वाले Android ऐप्लिकेशन.
- Chromium के अन्य ब्राउज़र, जैसे कि Microsoft Edge.
Chrome, इन शर्तों को पूरा करने वाले उपयोगकर्ताओं की संख्या का डेटा पब्लिश नहीं करता. हम जो डेटा इकट्ठा करते हैं उसके बारे में ज़्यादा जानने के लिए, निजता से जुड़ा Chrome का व्हाइट पेपर देखें.
Accelerated Mobile Pages (AMP)
एएमपी की मदद से बनाए गए पेजों को किसी भी दूसरे वेब पेज की तरह, CrUX डेटासेट में शामिल किया जाता है. जून 2020 के CrUX रिलीज़ तक, एएमपी कैश का इस्तेमाल करके दिखाए गए पेज और / या एएमपी व्यूअर में रेंडर किए गए पेज भी कैप्चर किए जाते हैं और इन्हें पब्लिशर के पेज के यूआरएल के साथ जोड़ा जाता है.
डेटा क्वालिटी
CrUX के डेटा को कुछ हद तक प्रोसेस किया जाता है, ताकि यह पक्का किया जा सके कि यह आंकड़ों के हिसाब से सटीक हो, सही तरीके से स्ट्रक्चर किया गया हो, और क्वेरी करने में आसान हो.
फ़िल्टर करना
CrUX डेटासेट को फ़िल्टर किया जाता है, ताकि यह पक्का किया जा सके कि दिया गया डेटा आंकड़ों के हिसाब से मान्य है. ऐसा करने से, हो सकता है कि पूरे पेज या ऑरिजिन, डेटासेट में न दिखें.
ऑरिजिन और पेजों पर लागू होने वाली ज़रूरी शर्तों के अलावा, डेटा में मौजूद सेगमेंट के लिए, अन्य फ़िल्टर भी इस्तेमाल किए जाते हैं:
ऐसे ऑरिजिन या पेजों को डेटासेट से पूरी तरह बाहर रखा जाता है जिनके कुल ट्रैफ़िक का 20% से ज़्यादा हिस्सा, डाइमेंशन के सही कॉम्बिनेशन की वजह से बाहर रखा जाता है.
ग्लोबल-लेवल डेटासेट में सभी देशों के उपयोगकर्ता अनुभव शामिल होते हैं. इसलिए, देश के लेवल पर लोकप्रियता की शर्तों को पूरा न करने वाले डाइमेंशन के कॉम्बिनेशन को अब भी ग्लोबल लेवल पर शामिल किया जा सकता है. हालांकि, इसके लिए ज़रूरी है कि उन डाइमेंशन की संख्या ज़रूरत के मुताबिक हो.
फ़ज़िंग
कुल ट्रैफ़िक वॉल्यूम जैसे संवेदनशील डेटा की रिवर्स इंजीनियरिंग को रोकने के लिए, डेटासेट में कुछ हद तक रैंडमनेस लागू की जाती है. इससे इकट्ठा किए गए आंकड़ों पर कोई असर नहीं पड़ता.
स्पष्टता
CrUX डेटासेट में मौजूद ज़्यादातर मेट्रिक की वैल्यू को वैल्यू और बिन साइज़ के हिस्टोग्राम के तौर पर दिखाया जाता है. यहां हिस्टोग्राम की वैल्यू, शामिल किए गए उन सभी सेगमेंट का कुछ हिस्सा होती है जिन्हें जोड़कर एक वैल्यू मिलती है. बिन के साइज़, 1.0 और 0.0001 के बीच के फ़्लोटिंग पॉइंट नंबर होते हैं.
डेटा को क्वेरी और विज़ुअलाइज़ करना आसान बनाने के लिए, हिस्टोग्राम बिन की चौड़ाई को नॉर्मलाइज़ किया जाता है. इसका मतलब है कि बड़े बिन को छोटे-छोटे बिन में बांटा जा सकता है और इनकी ओरिजनल डेंसिटी एक जैसी होती है, ताकि बिन की चौड़ाई एक जैसी बनी रहे.
लाइसेंस
Google के CrUX डेटासेट को क्रिएटिव कॉमंस एट्रिब्यूशन 4.0 इंटरनैशनल लाइसेंस के तहत लाइसेंस दिया गया है.