BigQuery पर CrUX

जानें कि BigQuery में CrUX डेटा को कैसे व्यवस्थित किया जाता है.

परिचय

Chrome UX रिपोर्ट (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया जाने वाला डेटाबेस है.

BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे 2017 से लेकर अब तक के पूरे डेटासेट की क्वेरी कर सकते हैं. उदाहरण के लिए, ट्रेंड का विश्लेषण करने, वेब टेक्नोलॉजी और बेंचमार्क डोमेन की तुलना करने के लिए.

इस डेटा को हर महीने की रिलीज़ और कई खास जानकारी वाली टेबल के हिसाब से तैयार किया जाता है. इससे डेटा को आसानी से ऐक्सेस किया जा सकता है.

BigQuery डेटा, CrUX डैशबोर्ड का आधार है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना इस डेटा को विज़ुअलाइज़ किया जा सकता है.

डेटासेट ऐक्सेस करना

BigQuery का इस्तेमाल करने के लिए, आपके पास Google Cloud खाता और एसक्यूएल की बुनियादी जानकारी होनी चाहिए. BigQuery पर मौजूद CrUX डेटासेट को फ़्री टीयर की सीमाओं तक ऐक्सेस और एक्सप्लोर किया जा सकता है. इसका रिन्यूअल हर महीने होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे उन्हें बिना किसी शुल्क के मिलने वाले टीयर के बाद के शुल्कों को चुकाने में मदद मिलेगी. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड दिया जाना ज़रूरी है. इस बारे में ज़्यादा जानने के लिए, मुझे क्रेडिट कार्ड देने की ज़रूरत क्यों है? सेक्शन देखें.

अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:

  1. Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
  2. अपने नए प्रोजेक्ट को "मेरी Chrome UX रिपोर्ट" जैसा नाम दें और 'बनाएं' पर क्लिक करें.
  3. अगर कहा जाए, तो अपनी बिलिंग जानकारी दें.
  4. BigQuery पर CrUX डेटासेट पर जाएं

अब डेटासेट से क्वेरी करने का समय आ गया है.

प्रोजेक्ट को मैनेज करना

BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की रिपोर्ट, chrome-ux-report.all में नई टेबल के तौर पर रिलीज़ की जाती है. इसमें कई मेटालाइज़ की गई टेबल भी होती हैं, जो हर महीने के आंकड़ों की खास जानकारी देती हैं.

पूरी जानकारी देने वाली टेबल स्कीमा

हर देश के लिए रॉ टेबल और all डेटासेट, साल और महीने के हिसाब से दिए गए हैं.

रॉ टेबल

रॉ टेबल का स्कीमा इस तरह का होता है:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

मटेरियलाइज़्ड टेबल स्कीमा

मेटालाइज़ की गई टेबल, कई मुख्य डाइमेंशन के हिसाब से समरी डेटा को आसानी से ऐक्सेस करने के लिए उपलब्ध कराई जाती हैं. कोई हिस्टोग्राम नहीं दिया जाता है. इसके बजाय, परफ़ॉर्मेंस के डेटा को परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, फ़्रैक्शन में एग्रीगेट किया जाता है. इस उदाहरण में, metrics_summary टेबल की उदाहरण पंक्तियों का एक सेट दिखाया गया है:

yyyymm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9,209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

इससे पता चलता है कि 202204 डेटासेट में, https://example.com पर 90.56% असल उपयोगकर्ता अनुभव, अच्छे एलसीपी की शर्तों को पूरा करते हैं. साथ ही, 75वें पर्सेंटाइल के हिसाब से एलसीपी की वैल्यू 1,600 मिलीसेकंड थी. यह पिछले महीनों की तुलना में थोड़ा कम है.

चार मटेरियलाइज़्ड टेबल दी गई हैं:

metrics_summary
महीने और ऑरिजिन के हिसाब से मुख्य मेट्रिक
device_summary
महीने, शुरुआत की जगह, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
महीने, शुरुआत की जगह, डिवाइस के टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
डेटासेट में शामिल सभी ऑरिजिन की सूची

metrics_summary

metrics_summary टेबल में, हर ऑरिजिन और हर महीने के डेटासेट की खास जानकारी वाले आंकड़े होते हैं:

yyyymm
डेटा इकट्ठा करने की अवधि का महीना
origin
साइट के ऑरिजिन का यूआरएल
rank
लोकप्रियता की अनुमानित रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
[fast|avg|slow]_<metric>
परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
p75_<metric>
परफ़ॉर्मेंस मेट्रिक का 75वां पर्सेंटाइल वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
सूचना की अनुमति से जुड़ी गतिविधियों का हिस्सा
[desktop|phone|tablet]Density
डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
बेहतर कनेक्शन टाइप के हिसाब से ट्रैफ़िक का हिस्सा
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
नेविगेशन टाइप का हिस्सा

device_summary

device_summary टेबल में महीने, शुरुआत की जगह, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े होते हैं. metrics_summary कॉलम के अलावा, ये भी शामिल हैं:

device
डिवाइस का डिवाइस का नाप या आकार

country_summary

country_summary टेबल में, महीने, ऑरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, ये भी शामिल हैं:

country_code
दो अक्षर वाला देश कोड
device
डिवाइस का डिवाइस का नाप या आकार

origin_summary

origin_summary टेबल में CrUX डेटासेट में दिए गए सभी ऑरिजिन की सूची मौजूद होती है. इसे डेटासेट में मौजूद ऑरिजिन की सबसे नई सूची के साथ हर महीने अपडेट किया जाता है. इसमें एक कॉलम होता है: origin.

प्रयोग के लिए बनाया गया डेटासेट

प्रयोग के तौर पर इस्तेमाल किए जा रहे डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM टेबल की कॉपी होती हैं. हालांकि, इनमें BigQuery की पार्टिशन और क्लस्टरिंग जैसी नई और बेहतर सुविधाओं का इस्तेमाल किया जाता है. इनकी मदद से, ज़्यादा तेज़ी से, आसानी से, और कम खर्च में क्वेरी लिखी जा सकती हैं.

country

experimental.country डेटासेट में, country_CC डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. यह स्कीमा, तारीख और country_code कॉलम के साथ रॉ टेबल की तरह होता है. इसकी मदद से, समय के साथ देश-लेवल पर तुलना की जा सकती है. इसके लिए, महीने वाली टेबल को जोड़ने की ज़रूरत नहीं है.

global

experimental.global डेटासेट में, all डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. यह स्कीमा, तारीख के साथ रॉ टेबल की तरह होता है. इसकी मदद से, महीने के हिसाब से टेबल को जोड़े बिना, समय के साथ-साथ क्वेरी को एक्ज़ीक्यूट किया जा सकता है.