Informationen zur Strukturierung von CrUX-Daten in BigQuery
Einführung
Die Rohdaten des Chrome UX-Berichts (CrUX) sind in BigQuery verfügbar, einer Datenbank, die in Google Cloud gehostet wird.
Mit CrUX in BigQuery können Nutzer den vollständigen Datensatz seit 2017 direkt abfragen, um beispielsweise Trends zu analysieren, Webtechnologien zu vergleichen und Domains zu benchmarken.
Die Daten sind nach monatlichen Releases sowie in einer Reihe von Zusammenfassungstabellen strukturiert, um den Zugriff auf die Daten zu vereinfachen.
Die BigQuery-Daten bilden die Grundlage des CrUX-Dashboards, mit dem Sie diese Daten visualisieren können, ohne SQL-Abfragen schreiben zu müssen.
Auf Dataset zugreifen
Für die Verwendung von BigQuery benötigen Sie ein Google Cloud-Konto und grundlegende SQL-Kenntnisse. Der CrUX-Dataset in BigQuery ist kostenlos zugänglich und kann bis zu den Limits der kostenlosen Stufe genutzt werden, die monatlich erneuert und von BigQuery bereitgestellt wird. Außerdem erhalten neue Google Cloud-Nutzer möglicherweise ein Guthaben bei der Registrierung, um Kosten zu decken, die über den kostenlosen Tarif hinausgehen. Für das Google Cloud-Projekt muss eine Kreditkarte angegeben werden. Weitere Informationen finden Sie unter Warum muss ich eine Kreditkarte angeben?.
Wenn Sie BigQuery zum ersten Mal verwenden, gehen Sie so vor, um ein Projekt einzurichten:
- Klicken Sie in der Google Cloud Console auf Projekt erstellen.
- Geben Sie Ihrem neuen Projekt einen Namen wie „Mein Chrome-UX-Bericht“ und klicken Sie auf „Erstellen“.
- Gib deine Zahlungsinformationen an, wenn du dazu aufgefordert wirst.
- Rufen Sie den CrUX-Dataset in BigQuery auf.
Jetzt können Sie mit dem Abfragen des Datensatzes beginnen.
Projektorganisation
CrUX-Daten in BigQuery werden am zweiten Dienstag des Folgemonats veröffentlicht. Jeder Monat wird als neue Tabelle unter chrome-ux-report.all
veröffentlicht. Außerdem gibt es eine Reihe von materialisierten Tabellen mit zusammenfassenden Statistiken für jeden Monat.
- `chrome-ux-report
Detaillierte Tabellenschema
Die Rohtabellen für jedes Land und der Datensatz all
werden nach Jahr und Monat bereitgestellt.
Rohtabellen
Die Rohtabellen haben das folgende Schema:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schema der materialisierten Tabelle
Materialisierte Tabellen ermöglichen einen einfacheren Zugriff auf zusammengefasste Daten nach einer Reihe wichtiger Dimensionen. Es werden keine Histogramme bereitgestellt. Stattdessen werden Leistungsdaten nach Leistungsbewertung und dem Wert des 75. Perzentils in Fraktionen zusammengefasst. In diesem Beispiel sind einige Beispielzeilen aus der Tabelle metrics_summary
zu sehen:
yyyymm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0.0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Das bedeutet, dass im Datensatz 202204 90,56% der Interaktionen echter Nutzer auf https://example.com
die Kriterien für einen guten LCP erfüllt haben und dass der LCP-Wert des groben 75. Perzentilwerts 1.600 ms betrug. Das ist etwas langsamer als in den Vormonaten.
Es werden vier materialisierte Tabellen bereitgestellt:
metrics_summary
- Wichtige Messwerte nach Monat und Herkunft
device_summary
- Wichtige Messwerte nach Monat, Herkunft und Gerätetyp
country_summary
- Wichtige Messwerte nach Monat, Herkunft, Gerätetyp und Land
origin_summary
- eine Liste aller im Datensatz enthaltenen Ursprünge
metrics_summary
Die Tabelle metrics_summary
enthält zusammenfassende Statistiken für jeden Ursprung und jedes monatliche Dataset:
yyyymm
- Monat des Zeitraums der Datenerhebung
origin
- URL der Website
rank
- Grobes Beliebtheitsranking (Stand: März 2021)
[small|medium|large]_cls
- Anteil des Traffics nach CLS-Grenzwerten
[fast|avg|slow]_<metric>
- Anteil des Traffics nach Leistungsgrenzwerten
p75_<metric>
- Wert des 75. Perzentils der Leistungsmesswerte (Millisekunden)
notification_permission_[accept|deny|ignore|dismiss]
- Anteil der Verhaltensweisen bei Berechtigungen zum Senden von Benachrichtigungen
[desktop|phone|tablet]Density
- Anteil des Traffics nach Formfaktor
[_4G|_3G|_2G|slow2G|offline]Density
- Anteil des Traffics nach effektivem Verbindungstyp
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- Anteil der Navigationstypen
device_summary
Die Tabelle device_summary
enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary
-Spalten gibt es:
device
- Formfaktor
country_summary
Die Tabelle country_summary
enthält zusammengefasste Statistiken nach Monat, Herkunft, Land und Gerät. Zusätzlich zu den metrics_summary
-Spalten gibt es:
country_code
- Ländercode mit zwei Buchstaben
device
- Formfaktor
origin_summary
Die Tabelle origin_summary
enthält eine Liste aller Ursprünge im CrUX-Dataset. Sie wird monatlich mit der neuesten Liste der Ursprünge im Dataset aktualisiert und hat eine einzige Spalte: origin
.
Experimentelles Dataset
Die Tabellen im experimentellen Datensatz sind exakte Kopien der standardmäßigen YYYYMM
-Tabellen. Sie nutzen jedoch neuere und erweiterte BigQuery-Funktionen wie Partitionierung und Clustering, mit denen Sie schnellere, einfachere und kostengünstigere Abfragen schreiben können.
country
Der Datensatz experimental.country
enthält aggregierte Daten aus den Datensätzen country_CC
mit einer zusätzlichen Spalte yyyymm
für das Dataset-Datum. Das Schema ist mit dem von rohen Tabellen identisch, mit Ausnahme der Spalten „Datum“ und „country_code
“. So können Vergleiche auf Länderebene über einen bestimmten Zeitraum ausgeführt werden, ohne dass die monatlichen Tabellen zusammengeführt werden müssen.
global
Der Datensatz experimental.global
enthält aggregierte Daten aus dem Datensatz all
mit einer zusätzlichen Spalte yyyymm
für das Dataset-Datum. Das Schema ist mit dem von rohen Tabellen identisch, mit dem Unterschied, dass das Datum hinzugefügt wird. So können Abfragen zum Vergleichen verschiedener Zeiträume ausgeführt werden, ohne dass die monatlichen Tabellen zusammengeführt werden müssen.