BigQuery'de CrUX

CrUX verilerinin BigQuery'de nasıl yapılandırıldığını öğrenin.

Giriş

Chrome Kullanıcı Deneyimi Raporu'nun (CrUX) temel aldığı ham veriler, Google Cloud'da barındırılan bir veritabanı olan BigQuery'de mevcuttur.

BigQuery'deki CrUX, kullanıcıların 2017'ye kadar uzanan tüm veri kümesini doğrudan sorgulamasına olanak tanır. Örneğin, trendleri analiz etmek, web teknolojilerini karşılaştırmak ve alan adlarını karşılaştırmak için bu veri kümesini kullanabilirsiniz.

Veriler, aylık sürüme göre yapılandırılır ve verileri sorgulamayı kolaylaştırmak için bir dizi özet tabloya sahiptir.

BigQuery verileri, SQL sorgusu yazmadan bu verileri görselleştirmenize olanak tanıyan CrUX Kontrol Paneli'nin temelini oluşturur.

Veri kümesine erişme

BigQuery'yi kullanmak için Google Cloud hesabınızın olması ve SQL hakkında temel düzeyde bilgi sahibi olmanız gerekir. BigQuery'deki CrUX veri kümesine, BigQuery tarafından sağlanan ve aylık olarak yenilenen ücretsiz katmanın sınırlarına kadar ücretsiz olarak erişilebilir ve bu veri kümesi keşfedilebilir. Ayrıca yeni Google Cloud kullanıcıları, ücretsiz katmanın üzerindeki harcamaları karşılamak için kayıt kredisi almaya uygun olabilir. Google Cloud projesi için kredi kartı sağlamanız gerektiğini unutmayın. Neden kredi kartı sağlamam gerekiyor? başlıklı makaleyi inceleyin.

BigQuery'yi ilk kez kullanıyorsanız proje oluşturmak için aşağıdaki adımları uygulayın:

  1. Google Cloud Console'da Proje Oluştur'a gidin.
  2. Yeni projenize "Chrome Kullanıcı Deneyimi Raporum" gibi bir ad verin ve Oluştur'u tıklayın.
  3. İstenirse fatura bilgilerinizi girin.
  4. BigQuery'deki CrUX veri kümesine gidin.

Artık veri kümesini sorgulamaya hazırsınız.

Proje organizasyonu

BigQuery'deki CrUX verileri, takip eden ayın ikinci Salı günü yayınlanır. Her ay chrome-ux-report.all altında yeni bir tablo olarak yayınlanır. Ayrıca her ay için özet istatistikler sağlayan bir dizi somutlaştırılmış tablo da vardır.

Ayrıntılı tablo şeması

Her ülke ve all veri kümesi için ham tablolar yıl ve aya göre sağlanır.

Ham tablolar

Ham tablolar aşağıdaki şemaya sahiptir:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Gerçekleştirilmiş tablo şeması

Materyalize tablolar, bir dizi temel boyuta göre özet verilere daha kolay erişmeniz için sağlanır. Histogram sağlanmaz. Bunun yerine performans verileri, performans değerlendirmesine ve 75. yüzdelik dilim değerine göre kesirlere toplanır. Bu örnekte, metrics_summary tablosundaki örnek satırlar gösterilmektedir:

yyyyaa kaynak fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1.400
202202 https://example.com 0,9169 0,0545 0,0284 1.500
202201 https://example.com 0,9072 0,0626 0,0298 1.500

Bu, 202204 veri kümesinde https://example.com'teki gerçek kullanıcı deneyimlerinin% 90,56'sının iyi LCP ölçütlerini karşıladığını ve kaba 75. yüzdelik dilim LCP değerinin 1.600 ms olduğunu gösterir. Bu, önceki aylara kıyasla biraz daha yavaş.

Dört somutlaştırılmış tablo sağlanır:

metrics_summary
aydan ve kaynaktan göre temel metrikler
device_summary
Aya, kaynağa ve cihaz türüne göre temel metrikler
country_summary
Ay, kaynak, cihaz türü ve ülkeye göre temel metrikler
origin_summary
Veri kümesine dahil edilen tüm kaynakların listesi

metrics_summary

metrics_summary tablosu, her kaynak ve her aylık veri kümesi için özet istatistikleri içerir:

yyyymm
Veri toplama döneminin ayı
origin
Site kaynağının URL'si
rank
Yaklaşık popülerlik sıralaması (Mart 2021 itibarıyla)
[small|medium|large]_cls
CLS eşiklerine göre trafik oranı
[fast|avg|slow]_<metric>
Performans eşiklerine göre trafik oranı
p75_<metric>
Performans metriklerinin 75. yüzde birlik dilim değeri (milisaniye)
notification_permission_[accept|deny|ignore|dismiss]
bildirim izni davranışlarının oranı
[desktop|phone|tablet]Density
Form faktörüne göre trafik oranı
[_4G|_3G|_2G|slow2G|offline]Density
geçerli bağlantı türüne göre trafik oranı
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
gezinme türlerinin oranı

device_summary

device_summary tablosu; aya, kaynağa, ülkeye ve cihaza göre toplanmış istatistikleri içerir. metrics_summary sütunlarına ek olarak şunlar da vardır:

device
Cihaz form faktörü

country_summary

country_summary tablosu; aya, kaynağa, ülkeye ve cihaza göre toplanmış istatistikleri içerir. metrics_summary sütunlarına ek olarak şunlar da vardır:

country_code
İki harfli ülke kodu
device
Cihaz form faktörü

origin_summary

origin_summary tablosu, CrUX veri kümesindeki tüm kaynakların listesini içerir. Veri kümesindeki en son kaynak listesiyle aylık olarak güncellenir ve tek bir sütuna sahiptir: origin.

Deneysel veri kümesi

Deneysel veri kümesindeki tablolar, varsayılan YYYYMM tablolarının tam kopyalarıdır ancak daha hızlı, daha basit ve daha ucuz sorgular yazmanızı sağlayan bölümleme ve küme oluşturma gibi daha yeni ve daha gelişmiş BigQuery özelliklerinden yararlanır.

country

experimental.country veri kümesi, veri kümesi tarihi için ek bir yyyymm sütunu içeren country_CC veri kümelerinden toplanmış verileri içerir. Şema, tarih ve country_code sütunlarının eklenmesi dışında ham tablolarla aynıdır. Bu sayede, aylık tablolar birleştirilmeden ülke düzeyinde zaman içindeki karşılaştırma sorguları yürütülebilir.

global

experimental.global veri kümesi, veri kümesi tarihi için ek bir yyyymm sütunu içeren all veri kümesinden birleştirilmiş verileri içerir. Şema, tarih eklenmiş ham tablolarla aynıdır. Bu sayede, aylık tablolar birleştirilmeden zaman içindeki karşılaştırma sorgularının yürütülmesine olanak tanır.