जानें कि BigQuery में CrUX डेटा को कैसे व्यवस्थित किया जाता है.
परिचय
Chrome UX रिपोर्ट (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया जाने वाला डेटाबेस है.
BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे 2017 से लेकर अब तक के पूरे डेटासेट की क्वेरी कर सकते हैं. उदाहरण के लिए, ट्रेंड का विश्लेषण करने, वेब टेक्नोलॉजी और बेंचमार्क डोमेन की तुलना करने के लिए.
डेटा को हर महीने रिलीज़ होने वाले डेटा के हिसाब से व्यवस्थित किया जाता है. साथ ही, डेटा को आसानी से क्वेरी करने के लिए, कई खास जानकारी वाली टेबल भी उपलब्ध कराई जाती हैं.
BigQuery डेटा, CrUX डैशबोर्ड का आधार है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना इस डेटा को विज़ुअलाइज़ किया जा सकता है.
डेटासेट ऐक्सेस करना
BigQuery का इस्तेमाल करने के लिए, आपके पास Google Cloud खाता और एसक्यूएल की बुनियादी जानकारी होनी चाहिए. BigQuery पर CrUX डेटासेट को फ़्री टीयर की सीमाओं तक ऐक्सेस और एक्सप्लोर किया जा सकता है. इसका रिन्यूअल हर महीने होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे उन्हें बिना शुल्क वाले टीयर के बाद के खर्चों को पूरा करने में मदद मिलेगी. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड की जानकारी देना ज़रूरी है. मुझे क्रेडिट कार्ड की जानकारी क्यों देनी होगी? देखें.
अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:
- Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
- अपने नए प्रोजेक्ट को कोई नाम दें, जैसे कि "मेरी Chrome UX रिपोर्ट". इसके बाद, 'बनाएं' पर क्लिक करें.
- अगर कहा जाए, तो अपनी बिलिंग जानकारी दें.
- BigQuery पर CrUX डेटासेट पर जाएं
अब डेटासेट से क्वेरी करने का समय आ गया है.
प्रोजेक्ट को मैनेज करना
BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की रिपोर्ट, chrome-ux-report.all
में नई टेबल के तौर पर रिलीज़ की जाती है. इसमें कई मेटालाइज़ की गई टेबल भी होती हैं, जो हर महीने के आंकड़ों की खास जानकारी देती हैं.
- `chrome-ux-report
टेबल स्कीमा के बारे में ज़्यादा जानकारी
हर देश के लिए रॉ टेबल और all
डेटासेट, साल और महीने के हिसाब से उपलब्ध कराया जाता है.
रॉ टेबल
रॉ टेबल का स्कीमा इस तरह का होता है:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
मेटालाइज़ की गई टेबल का स्कीमा
मेटालाइज़ की गई टेबल, कई मुख्य डाइमेंशन के हिसाब से समरी डेटा को आसानी से ऐक्सेस करने के लिए उपलब्ध कराई जाती हैं. कोई हिस्टोग्राम नहीं दिया जाता. इसके बजाय, परफ़ॉर्मेंस डेटा को परफ़ॉर्मेंस आकलन और 75वें पर्सेंटाइल वैल्यू के हिसाब से, फ़्रैक्शन में इकट्ठा किया जाता है. इस उदाहरण में, metrics_summary
टेबल की उदाहरण पंक्तियों का एक सेट दिखाया गया है:
yyyymm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
इससे पता चलता है कि 202204 डेटासेट में, https://example.com
पर 90.56% असल उपयोगकर्ता अनुभव, अच्छे एलसीपी की शर्तों को पूरा करते हैं. साथ ही, 75वें पर्सेंटाइल के हिसाब से एलसीपी की वैल्यू 1,600 मिलीसेकंड थी. यह पिछले महीनों की तुलना में थोड़ा कम है.
चार मेटालाइज़ की गई टेबल दी गई हैं:
metrics_summary
- महीने और ऑरिजिन के हिसाब से मुख्य मेट्रिक
device_summary
- महीने, ऑरिजिन, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
- महीने, ऑरिजिन, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
- डेटासेट में शामिल सभी ऑरिजिन की सूची
metrics_summary
metrics_summary
टेबल में, हर ऑरिजिन और हर महीने के डेटासेट के लिए खास जानकारी वाले आंकड़े होते हैं:
yyyymm
- डेटा इकट्ठा करने की अवधि का महीना
origin
- साइट के ऑरिजिन का यूआरएल
rank
- लोकप्रियता की अनुमानित रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
- सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
[fast|avg|slow]_<metric>
- परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
p75_<metric>
- परफ़ॉर्मेंस मेट्रिक की 75वीं पर्सेंटाइल वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
- सूचना पाने की अनुमति से जुड़े व्यवहार का प्रतिशत
[desktop|phone|tablet]Density
- डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
- बेहतर कनेक्शन टाइप के हिसाब से ट्रैफ़िक का हिस्सा
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- नेविगेशन टाइप का फ़्रैक्शन
device_summary
device_summary
टेबल में, महीने, ऑरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary
कॉलम के अलावा, ये भी शामिल हैं:
device
- डिवाइस का नाप या आकार
country_summary
country_summary
टेबल में, महीने, ऑरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary
कॉलम के अलावा, ये भी शामिल हैं:
country_code
- देश का दो अक्षर वाला कोड
device
- डिवाइस का नाप या आकार
origin_summary
origin_summary
टेबल में, CrUX डेटासेट के सभी ऑरिजिन की सूची होती है. इसे हर महीने, डेटासेट में ऑरिजिन की नई सूची के साथ अपडेट किया जाता है. इसमें एक कॉलम होता है: origin
.
एक्सपेरिमेंटल डेटासेट
एक्सपेरिमेंटल डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM
टेबल की सटीक कॉपी होती हैं. हालांकि, इनमें पार्टिशनिंग और क्लस्टरिंग जैसी BigQuery की नई और बेहतर सुविधाओं का इस्तेमाल किया जाता है. इनकी मदद से, तेज़ी से, आसानी से, और कम खर्च में क्वेरी लिखी जा सकती हैं.
country
experimental.country
डेटासेट में, country_CC
डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm
कॉलम होता है. यह स्कीमा, तारीख और country_code
कॉलम के साथ रॉ टेबल जैसा ही होता है. इससे, हर महीने की टेबल को जॉइन किए बिना, समय के साथ देश के लेवल पर तुलना करने वाली क्वेरी को लागू किया जा सकता है.
global
experimental.global
डेटासेट में, all
डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm
कॉलम होता है. यह स्कीमा, तारीख के साथ रॉ टेबल जैसा ही होता है. इससे, समय के साथ तुलना करने वाली क्वेरी को, हर महीने की टेबल को जॉइन किए बिना लागू किया जा सकता है.