BigQuery पर CrUX

जानें कि BigQuery में CrUX डेटा को कैसे व्यवस्थित किया जाता है.

परिचय

Chrome UX रिपोर्ट (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया जाने वाला डेटाबेस है.

BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे 2017 से लेकर अब तक के पूरे डेटासेट की क्वेरी कर सकते हैं. उदाहरण के लिए, ट्रेंड का विश्लेषण करने, वेब टेक्नोलॉजी और बेंचमार्क डोमेन की तुलना करने के लिए.

डेटा को हर महीने रिलीज़ होने वाले डेटा के हिसाब से व्यवस्थित किया जाता है. साथ ही, डेटा को आसानी से क्वेरी करने के लिए, कई खास जानकारी वाली टेबल भी उपलब्ध कराई जाती हैं.

BigQuery डेटा, CrUX डैशबोर्ड का आधार है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना इस डेटा को विज़ुअलाइज़ किया जा सकता है.

डेटासेट ऐक्सेस करना

BigQuery का इस्तेमाल करने के लिए, आपके पास Google Cloud खाता और एसक्यूएल की बुनियादी जानकारी होनी चाहिए. BigQuery पर CrUX डेटासेट को फ़्री टीयर की सीमाओं तक ऐक्सेस और एक्सप्लोर किया जा सकता है. इसका रिन्यूअल हर महीने होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे उन्हें बिना शुल्क वाले टीयर के बाद के खर्चों को पूरा करने में मदद मिलेगी. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड की जानकारी देना ज़रूरी है. मुझे क्रेडिट कार्ड की जानकारी क्यों देनी होगी? देखें.

अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:

  1. Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
  2. अपने नए प्रोजेक्ट को कोई नाम दें, जैसे कि "मेरी Chrome UX रिपोर्ट". इसके बाद, 'बनाएं' पर क्लिक करें.
  3. अगर कहा जाए, तो अपनी बिलिंग जानकारी दें.
  4. BigQuery पर CrUX डेटासेट पर जाएं

अब डेटासेट से क्वेरी करने का समय आ गया है.

प्रोजेक्ट को मैनेज करना

BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की रिपोर्ट, chrome-ux-report.all में नई टेबल के तौर पर रिलीज़ की जाती है. इसमें कई मेटालाइज़ की गई टेबल भी होती हैं, जो हर महीने के आंकड़ों की खास जानकारी देती हैं.

टेबल स्कीमा के बारे में ज़्यादा जानकारी

हर देश के लिए रॉ टेबल और all डेटासेट, साल और महीने के हिसाब से उपलब्ध कराया जाता है.

रॉ टेबल

रॉ टेबल का स्कीमा इस तरह का होता है:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

मेटालाइज़ की गई टेबल का स्कीमा

मेटालाइज़ की गई टेबल, कई मुख्य डाइमेंशन के हिसाब से समरी डेटा को आसानी से ऐक्सेस करने के लिए उपलब्ध कराई जाती हैं. कोई हिस्टोग्राम नहीं दिया जाता. इसके बजाय, परफ़ॉर्मेंस डेटा को परफ़ॉर्मेंस आकलन और 75वें पर्सेंटाइल वैल्यू के हिसाब से, फ़्रैक्शन में इकट्ठा किया जाता है. इस उदाहरण में, metrics_summary टेबल की उदाहरण पंक्तियों का एक सेट दिखाया गया है:

yyyymm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

इससे पता चलता है कि 202204 डेटासेट में, https://example.com पर 90.56% असल उपयोगकर्ता अनुभव, अच्छे एलसीपी की शर्तों को पूरा करते हैं. साथ ही, 75वें पर्सेंटाइल के हिसाब से एलसीपी की वैल्यू 1,600 मिलीसेकंड थी. यह पिछले महीनों की तुलना में थोड़ा कम है.

चार मेटालाइज़ की गई टेबल दी गई हैं:

metrics_summary
महीने और ऑरिजिन के हिसाब से मुख्य मेट्रिक
device_summary
महीने, ऑरिजिन, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
महीने, ऑरिजिन, डिवाइस टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
डेटासेट में शामिल सभी ऑरिजिन की सूची

metrics_summary

metrics_summary टेबल में, हर ऑरिजिन और हर महीने के डेटासेट के लिए खास जानकारी वाले आंकड़े होते हैं:

yyyymm
डेटा इकट्ठा करने की अवधि का महीना
origin
साइट के ऑरिजिन का यूआरएल
rank
लोकप्रियता की अनुमानित रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
[fast|avg|slow]_<metric>
परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
p75_<metric>
परफ़ॉर्मेंस मेट्रिक की 75वीं पर्सेंटाइल वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
सूचना पाने की अनुमति से जुड़े व्यवहार का प्रतिशत
[desktop|phone|tablet]Density
डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
बेहतर कनेक्शन टाइप के हिसाब से ट्रैफ़िक का हिस्सा
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
नेविगेशन टाइप का फ़्रैक्शन

device_summary

device_summary टेबल में, महीने, ऑरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, ये भी शामिल हैं:

device
डिवाइस का नाप या आकार

country_summary

country_summary टेबल में, महीने, ऑरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary कॉलम के अलावा, ये भी शामिल हैं:

country_code
देश का दो अक्षर वाला कोड
device
डिवाइस का नाप या आकार

origin_summary

origin_summary टेबल में, CrUX डेटासेट के सभी ऑरिजिन की सूची होती है. इसे हर महीने, डेटासेट में ऑरिजिन की नई सूची के साथ अपडेट किया जाता है. इसमें एक कॉलम होता है: origin.

एक्सपेरिमेंटल डेटासेट

एक्सपेरिमेंटल डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM टेबल की सटीक कॉपी होती हैं. हालांकि, इनमें पार्टिशनिंग और क्लस्टरिंग जैसी BigQuery की नई और बेहतर सुविधाओं का इस्तेमाल किया जाता है. इनकी मदद से, तेज़ी से, आसानी से, और कम खर्च में क्वेरी लिखी जा सकती हैं.

country

experimental.country डेटासेट में, country_CC डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. यह स्कीमा, तारीख और country_code कॉलम के साथ रॉ टेबल जैसा ही होता है. इससे, हर महीने की टेबल को जॉइन किए बिना, समय के साथ देश के लेवल पर तुलना करने वाली क्वेरी को लागू किया जा सकता है.

global

experimental.global डेटासेट में, all डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm कॉलम होता है. यह स्कीमा, तारीख के साथ रॉ टेबल जैसा ही होता है. इससे, समय के साथ तुलना करने वाली क्वेरी को, हर महीने की टेबल को जॉइन किए बिना लागू किया जा सकता है.