BigQuery'de CrUX

CrUX verilerinin BigQuery'de nasıl yapılandırıldığını öğrenin.

Giriş

Chrome Kullanıcı Deneyimi Raporu'nun (CrUX) arkasındaki ham verilere, Google Cloud'da barındırılan bir veritabanı olan BigQuery'de ulaşılabilir.

BigQuery'de CrUX, kullanıcıların 2017'ye kadar giden veri kümesinin tamamını doğrudan sorgulamasına olanak tanıyor. Böylece trendleri analiz edebiliyor, web teknolojilerini karşılaştırabiliyor ve alanları karşılaştırabiliyor.

Veriler, sorgulanması için kolay bir erişim sağlamak amacıyla bir dizi özet tabloya ve aylık yayına göre yapılandırılır.

BigQuery verileri, SQL sorguları yazmadan bu verileri görselleştirmenize olanak tanıyan CrUX Kontrol Paneli'nin temelini oluşturur.

Veri kümesine erişme

BigQuery'yi kullanmak için bir Google Cloud hesabı ve temel SQL bilgisi gerekir. BigQuery'deki CrUX veri kümesine, aylık olarak yenilenen ve BigQuery tarafından sağlanan ücretsiz katmanın sınırlarına kadar ücretsiz olarak erişebilir ve bu veri kümesini keşfedebilirsiniz. Ayrıca yeni Google Cloud kullanıcıları, ücretsiz katmanın dışındaki masrafları karşılamak için kayıt kredisi almaya hak kazanabilir. Google Cloud projesi için kredi kartı sağlanması gerektiğini unutmayın. Neden kredi kartı sağlamam gerekiyor? bölümüne göz atın.

BigQuery'yi ilk kez kullanıyorsanız proje oluşturmak için aşağıdaki adımları uygulayın:

  1. Google Cloud Console'da Proje Oluştur'a gidin.
  2. Yeni projenize "Chrome Kullanıcı Deneyimi Raporum" gibi bir ad verin ve Oluştur'u tıklayın.
  3. İstenirse fatura bilgilerinizi sağlayın.
  4. BigQuery'deki CrUX veri kümesine gidin

Artık veri kümesini sorgulamaya hazırsınız.

Proje organizasyonu

BigQuery'deki CrUX verileri, bir sonraki ayın ikinci salı günü yayınlanır. Her ay, chrome-ux-report.all altında yeni bir tablo olarak yayınlanır. Ayrıca her ay için özet istatistikler sağlayan çok sayıda gerçekleştirilmiş tablo mevcuttur.

Ayrıntılı tablo şeması

Her ülke ve all veri kümesi için ham tablolar yıl ve aya göre sağlanmıştır.

Çiğ masalar

Ham tablolar aşağıdaki şemaya sahiptir:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Gerçekleştirilmiş tablo şeması

Özet verilerine bir dizi önemli boyutla daha kolay erişim sağlamak için gerçekleştirilmiş tablolar sağlanır. Histogramlar sağlanmaz. Bunun yerine, performans verileri performans değerlendirmesi ve 75. yüzdelik dilim değerine göre kesirler halinde toplanır. Bu örnekte, metrics_summary tablosundaki bir dizi örnek satır gösterilmektedir:

yyyyaa kaynak fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1.600
202203 https://example.com 0,9209 0,052 0,0274 1.400
202202 https://example.com 0,9169 0,0545 0,0284 1.500
202201 https://example.com 0,9072 0,0626 0,0298 1.500

Bu, 202204 veri kümesinde https://example.com üzerindeki gerçek kullanıcı deneyimlerinin% 90,56'sının iyi LCP ölçütlerini karşıladığını ve yaklaşık 75. yüzdelik dilim LCP değerinin 1.600 ms olduğunu gösterir. Bu, önceki aylara göre biraz daha yavaş.

Dört gerçekleştirilmiş tablo sağlanır:

metrics_summary
aya ve kaynağa göre temel metrikler
device_summary
ay, kaynak ve cihaz türüne göre temel metrikler
country_summary
ay, kaynak, cihaz türü ve ülke bazında temel metrikler
origin_summary
veri kümesine dahil edilen tüm kaynakların listesi

metrics_summary

metrics_summary tablosu, her kaynak ve aylık veri kümesi için özet istatistikleri içerir:

yyyymm
Veri toplama döneminin ayı
origin
Site kaynağının URL'si
rank
Yaklaşık popülerlik sıralaması (Mart 2021 itibarıyla)
[small|medium|large]_cls
trafiğin CLS eşiklerine göre oranı
[fast|avg|slow]_<metric>
trafiğin performans eşiklerine göre oranı
p75_<metric>
Performans metriklerinin 75. yüzdelik dilim değeri (milisaniye)
notification_permission_[accept|deny|ignore|dismiss]
bildirim izin davranışlarının oranı
[desktop|phone|tablet]Density
trafiğin form faktörü bazında oranı
[_4G|_3G|_2G|slow2G|offline]Density
etkili bağlantı türüne göre trafiğin oranı
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
gezinme türlerinin oranı

device_summary

device_summary tablosu ay, kaynak, ülke ve cihaza göre toplu istatistikleri içerir. metrics_summary sütununa ek olarak şunlar da bulunur:

device
Cihaz form faktörü

country_summary

country_summary tablosu ay, kaynak, ülke ve cihaza göre toplu istatistikleri içerir. metrics_summary sütununa ek olarak şunlar da bulunur:

country_code
İki harfli ülke kodu
device
Cihaz form faktörü

origin_summary

origin_summary tablosu, CrUX veri kümesindeki tüm kaynakların listesini içerir. Her ay, veri kümesindeki en son kaynak listesiyle güncellenir ve tek bir sütun içerir: origin.

Deneysel veri kümesi

Deneysel veri kümesindeki tablolar, varsayılan YYYYMM tablolarının bire bir kopyalarıdır ancak daha hızlı, daha basit ve daha ucuz sorgular yazmanıza olanak tanıyan bölümlendirme ve kümeleme gibi daha yeni ve gelişmiş BigQuery özelliklerini kullanır.

country

experimental.country veri kümesi, veri kümesi tarihi için ek bir yyyymm sütunuyla birlikte country_CC veri kümelerinden toplanan verileri içerir. Şema, tarih ve country_code sütunlarının eklenmesiyle birlikte ham tablolara benzer. Bu, zaman içinde sorguların, aylık tablolar birleştirilmeden yürütülmesine olanak tanır.

global

experimental.global veri kümesi, veri kümesi tarihi için ek bir yyyymm sütunuyla birlikte all veri kümesinden birleştirilmiş veriler içerir. Şema, tarihin eklenmesiyle birlikte ham tablolara benzer. Bu, zaman içindeki karşılaştırmaların, aylık tablolar birleştirilmeden yürütülmesine olanak tanır.