Crux op BigQuery

Ontdek hoe CrUX-gegevens zijn gestructureerd op BigQuery.

Invoering

De ruwe gegevens achter het Chrome UX Report (CrUX) zijn beschikbaar op BigQuery , een database die wordt gehost op Google Cloud.

Met CrUX op BigQuery kunnen gebruikers rechtstreeks de volledige dataset raadplegen, teruggaand tot 2017, om bijvoorbeeld trends te analyseren, webtechnologieën te vergelijken en domeinen te benchmarken.

De gegevens zijn gestructureerd per maandelijkse publicatie en bevatten een aantal samenvattende tabellen om snellere toegang te bieden voor het raadplegen van de gegevens.

De BigQuery-gegevens vormen de basis van het CrUX Dashboard , waarmee u deze gegevens kunt visualiseren zonder dat u SQL-query's hoeft te schrijven.

Toegang tot de dataset

Voor het gebruik van BigQuery hebt u een Google Cloud-account en basiskennis van SQL nodig. De CrUX-dataset op BigQuery is gratis toegankelijk en te gebruiken tot de limieten van de gratis versie , die maandelijks wordt verlengd en door BigQuery wordt aangeboden. Nieuwe Google Cloud-gebruikers komen mogelijk in aanmerking voor een tegoed om kosten te dekken die hoger zijn dan de gratis versie. Houd er rekening mee dat u een creditcard moet opgeven voor het Google Cloud-project. Zie Waarom moet ik een creditcard opgeven?

Als dit de eerste keer is dat u BigQuery gebruikt, volgt u deze stappen om een project in te stellen:

  1. Ga naar Een project maken op de Google Cloud-console .
  2. Geef uw nieuwe project een naam, bijvoorbeeld 'Mijn Chrome UX-rapport' en klik op Maken.
  3. Geef uw factuurgegevens op als daarom wordt gevraagd.
  4. Navigeer naar de CrUX-dataset op BigQuery

U bent nu klaar om de dataset te bevragen.

Projectorganisatie

CrUX-gegevens op BigQuery worden op de tweede dinsdag van de volgende maand vrijgegeven. Elke maand wordt een nieuwe tabel gepubliceerd onder chrome-ux-report.all . Er zijn ook een aantal gematerialiseerde tabellen die samenvattende statistieken voor elke maand bevatten.

Gedetailleerd tabelschema

De ruwe tabellen voor elk land en de all dataset worden per jaar en maand verstrekt.

Ruwe tabellen

De onbewerkte tabellen hebben het volgende schema:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Gematerialiseerd tabelschema

Gematerialiseerde tabellen zorgen voor eenvoudigere toegang tot samenvattingsgegevens voor een aantal belangrijke dimensies. Er worden geen histogrammen verstrekt; prestatiegegevens worden in plaats daarvan geaggregeerd in fracties op basis van prestatiebeoordeling en de 75e percentielwaarde. In dit voorbeeld wordt een set voorbeeldrijen uit de tabel metrics_summary weergegeven:

jjjjmm oorsprong snel_lcp gem_lcp slow_lcp p75_lcp
202204 https://voorbeeld.com 0,9056 0,0635 0,0301 1600
202203 https://voorbeeld.com 0,9209 0,052 0,0274 1400
202202 https://voorbeeld.com 0,9169 0,0545 0,0284 1500
202201 https://voorbeeld.com 0,9072 0,0626 0,0298 1500

Dit laat zien dat in de dataset van 2022-2004 90,56% van de gebruikerservaringen op https://example.com voldeed aan de criteria voor een goede LCP , en dat de grove LCP-waarde van het 75e percentiel 1600 ms bedroeg. Dit is iets langzamer dan voorgaande maanden.

Er zijn vier gematerialiseerde tabellen beschikbaar:

metrics_summary
belangrijkste statistieken per maand en herkomst
device_summary
belangrijkste statistieken per maand, herkomst en apparaattype
country_summary
belangrijkste statistieken per maand, herkomst, apparaattype en land
origin_summary
een lijst van alle oorsprongen die in de dataset zijn opgenomen

metrics_summary

De tabel metrics_summary bevat samenvattende statistieken voor elke oorsprong en elke maandelijkse dataset:

yyyymm
Maand van de gegevensverzamelingsperiode
origin
URL van de oorsprong van de site
rank
Grofweg populariteitsrangschikking (vanaf maart 2021 )
[small|medium|large]_cls
fractie van het verkeer volgens CLS-drempels
[fast|avg|slow]_<metric>
fractie van het verkeer op basis van prestatiedrempels
[low|medium|high]_rtt
fractie van het verkeer volgens RTT-drempels
p75_<metric>
75e percentielwaarde van prestatiemetingen (milliseconden)
notification_permission_[accept|deny|ignore|dismiss]
fractie van het gedrag voor meldingstoestemming
[desktop|phone|tablet]Density
fractie van het verkeer per vormfactor
[_4G|_3G|_2G|slow2G|offline]Density
fractie van het verkeer per effectief verbindingstype (berekend op basis van rtt -histogrammen van februari 2025 , zonder offline)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
fractie van navigatietypen

device_summary

De tabel device_summary bevat geaggregeerde statistieken per maand, herkomst, land en apparaat. Naast de kolommen metrics_summary is er:

device
Vormfactor van het apparaat

country_summary

De tabel country_summary bevat geaggregeerde statistieken per maand, herkomst, land en apparaat. Naast de kolommen metrics_summary is er:

country_code
Landcode van twee letters
device
Vormfactor van het apparaat

origin_summary

De tabel origin_summary bevat een lijst met alle oorsprongen in de CrUX-dataset. Deze wordt maandelijks bijgewerkt met de meest recente lijst met oorsprongen in de dataset en heeft één kolom: origin .

Experimentele dataset

De tabellen in de experimentele dataset zijn exacte kopieën van de standaard YYYYMM -tabellen, maar ze maken gebruik van nieuwere en geavanceerdere BigQuery-functies zoals partitionering en clustering . Hiermee kunt u snellere, eenvoudigere en goedkopere query's schrijven.

country

De dataset experimental.country bevat geaggregeerde gegevens uit de country_CC -datasets met een extra kolom yyyymm voor de datum van de dataset. Het schema is identiek aan dat van de onbewerkte tabellen , met de toevoeging van de kolommen date en country_code , waardoor query's voor vergelijking op landniveau in de tijd kunnen worden uitgevoerd zonder de maandelijkse tabellen te koppelen.

global

De dataset experimental.global bevat geaggregeerde gegevens uit de all dataset met een extra kolom yyyymm voor de datum van de dataset. Het schema is identiek aan dat van onbewerkte tabellen met de toevoeging van de datum, waardoor query's voor tijdsvergelijking kunnen worden uitgevoerd zonder de maandelijkse tabellen te koppelen.