CrUX in BigQuery

Hier erfahren Sie, wie CrUX-Daten in BigQuery strukturiert sind.

Einführung

Die Rohdaten des Chrome UX Report (CrUX) sind in BigQuery verfügbar, einer in Google Cloud gehosteten Datenbank.

Mit CrUX auf BigQuery können Nutzer den gesamten Datensatz seit 2017 direkt abfragen, um beispielsweise Trends zu analysieren, Webtechnologien zu vergleichen und Domains zu vergleichen.

Die Daten sind nach monatlicher Veröffentlichung strukturiert. Außerdem gibt es eine Reihe von Zusammenfassungstabellen, die einen schnelleren Zugriff auf die Daten ermöglichen.

Die BigQuery-Daten sind die Grundlage des CrUX-Dashboards, mit dem Sie diese Daten visualisieren können, ohne SQL-Abfragen schreiben zu müssen.

Auf Dataset zugreifen

Für die Verwendung von BigQuery sind ein Google Cloud-Konto und grundlegende SQL-Kenntnisse erforderlich. Auf das CrUX-Dataset in BigQuery kann kostenlos zugegriffen und es kann bis zu den Limits der kostenlosen Stufe genutzt werden. Diese wird monatlich von BigQuery erneuert. Außerdem erhalten neue Google Cloud-Nutzer möglicherweise ein Anmeldeguthaben, um Ausgaben zu decken, die über das kostenlose Kontingent hinausgehen. Für das Google Cloud-Projekt muss eine Kreditkarte angegeben werden. Weitere Informationen finden Sie unter Warum muss ich eine Kreditkarte angeben?.

Wenn Sie BigQuery zum ersten Mal verwenden, gehen Sie so vor, um ein Projekt einzurichten:

Rufen Sie in der Google Cloud Console die Seite Projekt erstellen auf.
Geben Sie Ihrem neuen Projekt einen Namen wie „Mein Chrome UX-Bericht“ und klicken Sie auf „Erstellen“.
Geben Sie Ihre Zahlungsinformationen an, wenn Sie dazu aufgefordert werden.
CrUX-Dataset in BigQuery aufrufen

Jetzt können Sie mit dem Abfragen des Datasets beginnen.

Projekte organisieren

CrUX-Daten in BigQuery werden am zweiten Dienstag des Folgemonats veröffentlicht. Jeder Monat wird als neue Tabelle unter chrome-ux-report.all veröffentlicht. Außerdem gibt es eine Reihe von materialisierten Tabellen mit zusammenfassenden Statistiken für jeden Monat.

`chrome-ux-report
- all
  - YYYYMM
- country_CC
  - YYYYMM
- experimental
  - country
  - global
- materialized

Detailliertes Tabellenschema

Die Rohdatentabellen für jedes Land und das Dataset all werden nach Jahr und Monat bereitgestellt.

Rohdatentabellen

Die Rohdatentabellen haben das folgende Schema:

origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
- cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
- navigate
- navigate_cache
- reload
- restore
- back_forward
- back_forward_cache
- prerender
experimental
- permission
  - notifications
- time_to_first_byte
- popularity

Schema der materialisierten Tabelle

Materialisierte Tabellen ermöglichen einen einfacheren Zugriff auf zusammengefasste Daten nach einer Reihe von wichtigen Dimensionen. Es werden keine Histogramme bereitgestellt. Stattdessen werden Leistungsdaten nach Leistungsbewertung und 75. Perzentilwert in Fraktionen aggregiert. In diesem Beispiel sehen Sie einige Beispielzeilen aus der Tabelle metrics_summary:

jjjjmm	origin	fast_lcp	avg_lcp	slow_lcp	p75_lcp
202204	https://example.com	0,9056	0,0635	0,0301	1600
202203	https://example.com	0,9209	0,052	0,0274	1400
202202	https://example.com	0,9169	0,0545	0.0284	1500
202201	https://example.com	0,9072	0,0626	0,0298	1500

Das bedeutet, dass im Dataset 202204 90,56% der Nutzererfahrungen auf https://example.com die Kriterien für einen guten LCP erfüllt haben und der grobe LCP-Wert des 75. Perzentils 1.600 ms betrug. Das ist etwas langsamer als in den Vormonaten.

Es sind vier materialisierte Tabellen verfügbar:

metrics_summary: wichtige Messwerte nach Monat und Herkunft
device_summary: wichtige Messwerte nach Monat, Herkunft und Gerätetyp
country_summary: wichtige Messwerte nach Monat, Herkunft, Gerätetyp und Land
origin_summary: eine Liste aller im Dataset enthaltenen Ursprünge

`metrics_summary`

Die Tabelle metrics_summary enthält zusammenfassende Statistiken für jeden Ursprung und jedes monatliche Dataset:

yyyymm: Monat des Datenerfassungszeitraums
origin: URL des Website-Ursprungs
rank: Grobe Beliebtheitsrangfolge (Stand: März 2021)
[small|medium|large]_cls: Anteil des Traffics nach CLS-Grenzwerten
[fast|avg|slow]_<metric>: Anteil des Traffics nach Leistungsschwellen
[low|medium|high]_rtt: Anteil des Traffics nach RTT-Grenzwerten
p75_<metric>: Wert des 75. Perzentils der Leistungsmesswerte (Millisekunden)
notification_permission_[accept|deny|ignore|dismiss]: Anteil der Verhaltensweisen bei der Berechtigung zum Senden von Benachrichtigungen
[desktop|phone|tablet]Density: Anteil des Traffics nach Formfaktor
[_4G|_3G|_2G|slow2G|offline]Density: Anteil des Traffics nach effektivem Verbindungstyp (berechnet aus rtt-Histogrammen ab Februar 2025, ohne Offline)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]: Anteil der Navigationstypen

`device_summary`

Die Tabelle device_summary enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary-Spalten gibt es:

device: Formfaktor des Geräts

`country_summary`

Die Tabelle country_summary enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary-Spalten gibt es:

country_code: Ländercode mit zwei Buchstaben
device: Formfaktor des Geräts

`origin_summary`

Die Tabelle origin_summary enthält eine Liste aller Ursprünge im CrUX-Dataset. Sie wird monatlich mit der neuesten Liste der Ursprünge im Dataset aktualisiert und hat eine einzelne Spalte: origin.

Experimentelles Dataset

Die Tabellen im experimentellen Dataset sind exakte Kopien der Standardtabellen YYYYMM. Sie nutzen jedoch neuere und fortschrittlichere BigQuery-Funktionen wie Partitionierung und Clustering, mit denen Sie schnellere, einfachere und kostengünstigere Abfragen schreiben können.

`country`

Das Dataset experimental.country enthält zusammengefasste Daten aus den Datasets country_CC mit einer zusätzlichen Spalte yyyymm für das Dataset-Datum. Das Schema ist identisch mit dem von Rohdatentabellen. Es enthält zusätzlich die Spalten „date“ und country_code. So können Vergleiche auf Länderebene über Zeitabfragen hinweg ausgeführt werden, ohne dass die monatlichen Tabellen verknüpft werden müssen.

`global`

Das Dataset experimental.global enthält aggregierte Daten aus dem Dataset all mit einer zusätzlichen Spalte yyyymm für das Dataset-Datum. Das Schema ist identisch mit dem von Rohdatentabellen. Es wird jedoch das Datum hinzugefügt, sodass Zeitvergleichsabfragen ausgeführt werden können, ohne die monatlichen Tabellen zu verknüpfen.

CrUX in BigQuery Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.