BigQuery पर CrUX डेटा को स्ट्रक्चर्ड करने का तरीका जानें.
शुरुआती जानकारी
Chrome UX रिपोर्ट (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह डेटाबेस, Google Cloud पर होस्ट किया जाता है.
BigQuery पर CrUX की मदद से उपयोगकर्ता, 2017 के पूरे डेटासेट के लिए सीधे क्वेरी कर सकते हैं. उदाहरण के लिए, रुझानों का विश्लेषण करना, वेब टेक्नोलॉजी और मानदंड डोमेन की तुलना करना.
इस डेटा को हर महीने की रिलीज़ के हिसाब से बनाया जाता है. साथ ही, इसमें खास जानकारी वाली कई टेबल भी होती हैं, ताकि डेटा को आसानी से ऐक्सेस किया जा सके.
BigQuery डेटा, CrUX डैशबोर्ड का आधार होता है. इसकी मदद से, SQL क्वेरी लिखे बिना ही इस डेटा को विज़ुअलाइज़ किया जा सकता है.
डेटासेट ऐक्सेस करना
BigQuery का इस्तेमाल करने के लिए, आपके पास Google Cloud खाता और SQL की बुनियादी जानकारी होना ज़रूरी है. BigQuery पर CrUX डेटासेट को बिना किसी शुल्क के ऐक्सेस किया जा सकता है. साथ ही, फ़्री टीयर की सीमा तक, इसे एक्सप्लोर किया जा सकता है. इसे हर महीने रिन्यू किया जाता है और BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ता, साइनअप क्रेडिट पा सकते हैं, ताकि फ़्री टियर के अलावा किए जाने वाले खर्चों को पूरा किया जा सके. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए, क्रेडिट कार्ड देना ज़रूरी है. ज़्यादा जानने के लिए, मुझे क्रेडिट कार्ड क्यों देना होगा? देखें.
अगर BigQuery का इस्तेमाल पहली बार किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:
- Google Cloud कंसोल में प्रोजेक्ट बनाएं पर जाएं.
- अपने नए प्रोजेक्ट को "मेरी Chrome UX रिपोर्ट" जैसा नाम दें और 'बनाएं' पर क्लिक करें.
- अनुरोध किए जाने पर बिलिंग की जानकारी दें.
- BigQuery में CrUX डेटासेट पर जाएं
अब आप डेटासेट के लिए क्वेरी करने के लिए तैयार हैं.
प्रोजेक्ट को व्यवस्थित करना
BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने को chrome-ux-report.all
के तहत, नई टेबल के तौर पर रिलीज़ किया जाता है. यहां कई मटीरियलाइज़्ड टेबल भी होती हैं, जो हर महीने के आंकड़ों की खास जानकारी देती हैं.
- `chrome-ux-report
ज़्यादा जानकारी वाला टेबल स्कीमा
हर देश और all
डेटासेट के लिए रॉ टेबल, साल और महीने के हिसाब से दी जाती हैं.
रॉ टेबल
रॉ टेबल में यह स्कीमा होता है:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
मटीरियलाइज़्ड टेबल स्कीमा
मटीरियलाइज़्ड टेबल कई मुख्य डाइमेंशन के ज़रिए खास जानकारी को आसानी से ऐक्सेस करने के लिए दी जाती हैं. कोई हिस्टोग्राम नहीं दिया गया है. इसके बजाय, परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, परफ़ॉर्मेंस के डेटा को अलग-अलग हिस्सों में बांटा जाता है. इस उदाहरण में, metrics_summary
टेबल की उदाहरण वाली पंक्तियों का एक सेट दिखाया गया है:
yyyymm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1,600 |
202203 | https://example.com | 0.9,209 | 0.052 | 0.0274 | 1,400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
इससे पता चलता है कि 202204 के डेटासेट में, https://example.com
पर 90.56% असल उपयोगकर्ता अनुभव अच्छे एलसीपी की शर्त पूरी करता है. साथ ही, अनुमानित 75वां पर्सेंटाइल एलसीपी वैल्यू 1,600 मि॰से॰ है. यह पिछले महीनों की तुलना में थोड़ा धीमा है.
चार मटीरियलाइज़्ड टेबल दी गई हैं:
metrics_summary
- महीने और शुरुआत की जगह के हिसाब से मुख्य मेट्रिक
device_summary
- महीने, शुरुआत की जगह, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
- महीने, शुरुआत की जगह, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
- डेटासेट में शामिल सभी ऑरिजिन की सूची
metrics_summary
metrics_summary
टेबल में, हर ऑरिजिन और हर महीने के डेटासेट की खास जानकारी वाले आंकड़े शामिल होते हैं:
yyyymm
- डेटा इकट्ठा करने की अवधि का महीना
origin
- साइट के ऑरिजिन का यूआरएल
rank
- औसत लोकप्रियता की रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
- सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
[fast|avg|slow]_<metric>
- परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
p75_<metric>
- परफ़ॉर्मेंस मेट्रिक का 75वां पर्सेंटाइल वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
- सूचना की अनुमति के व्यवहार का हिस्सा
[desktop|phone|tablet]Density
- डिवाइस के नाप या आकार के हिसाब से, ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
- असरदार कनेक्शन टाइप के हिसाब से, ट्रैफ़िक का हिस्सा
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- नेविगेशन टाइप का हिस्सा
device_summary
device_summary
टेबल में महीने, शुरुआत की जगह, देश, और डिवाइस के हिसाब से इकट्ठा किए गए आंकड़े मौजूद हैं. metrics_summary
कॉलम के अलावा:
device
- डिवाइस का डिवाइस का नाप या आकार
country_summary
country_summary
टेबल में महीने, शुरुआत की जगह, देश, और डिवाइस के हिसाब से इकट्ठा किए गए आंकड़े मौजूद हैं. metrics_summary
कॉलम के अलावा:
country_code
- दो अक्षर वाला देश कोड
device
- डिवाइस का डिवाइस का नाप या आकार
origin_summary
origin_summary
टेबल में CrUX डेटासेट में मौजूद सभी ऑरिजिन की सूची शामिल होती है. इसे डेटासेट में ऑरिजिन की नई सूची के साथ हर महीने अपडेट किया जाता है और इसमें एक कॉलम होता है: origin
.
एक्सपेरिमेंट के लिए उपलब्ध डेटासेट
एक्सपेरिमेंट के तौर पर उपलब्ध डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM
टेबल की हूबहू कॉपी होती हैं. हालांकि, उनमें पार्टिशनिंग और क्लस्टरिंग जैसी नई और ज़्यादा बेहतर BigQuery सुविधाओं का इस्तेमाल किया जाता है. इनकी मदद से, तेज़ी से, आसान, और सस्ती क्वेरी लिखी जा सकती हैं.
country
experimental.country
डेटासेट में, country_CC
डेटासेट से इकट्ठा किया गया डेटा होता है. इस डेटा में, डेटासेट की तारीख के लिए एक और yyyymm
कॉलम होता है. स्कीमा, तारीख और country_code
कॉलम जोड़ने वाली रॉ टेबल की तरह होता है. इससे समय के साथ देश के लेवल की तुलना की जा सकती है, लेकिन महीने की टेबल को जोड़े बिना ही क्वेरी चलाई जा सकती हैं.
global
experimental.global
डेटासेट में, all
डेटासेट से इकट्ठा किया गया डेटा होता है. इस डेटा में, डेटासेट की तारीख के लिए एक और yyyymm
कॉलम होता है. स्कीमा, तारीख के साथ रॉ टेबल की तरह होता है. इससे हर महीने की टेबल में शामिल हुए बिना, टाइम के साथ क्वेरी को एक्ज़ीक्यूट किया जा सकता है.