Informationen zur Strukturierung von CrUX-Daten in BigQuery.
Einleitung
Die Rohdaten hinter dem UX-Bericht für Chrome (CrUX) sind in BigQuery verfügbar, einer in Google Cloud gehosteten Datenbank.
Mit CrUX in BigQuery können Nutzer den vollständigen Datensatz direkt abfragen, der bis 2017 zurückreicht, um beispielsweise Trends zu analysieren, Webtechnologien und Benchmark-Domains zu vergleichen.
Die Daten sind nach dem monatlichen Release und einer Reihe von Zusammenfassungstabellen strukturiert, um einen einfachen Zugriff auf die Datenabfrage zu ermöglichen.
Die BigQuery-Daten sind die Grundlage des CrUX-Dashboards, mit dem Sie diese Daten visualisieren können, ohne SQL-Abfragen schreiben zu müssen.
Auf Dataset zugreifen
Für die Verwendung von BigQuery sind ein Google Cloud-Konto und Grundkenntnisse in SQL erforderlich. Auf das CrUX-Dataset in BigQuery können Sie bis zu den Limits der kostenlosen Stufe, die monatlich verlängert wird und von BigQuery bereitgestellt wird, kostenlos zugreifen und es erkunden. Neue Google Cloud-Nutzer haben möglicherweise Anspruch auf ein Registrierungsguthaben, um Ausgaben über die kostenlose Stufe hinaus abzudecken. Für das Google Cloud-Projekt muss eine Kreditkarte angegeben werden. Weitere Informationen finden Sie unter Warum muss ich eine Kreditkarte angeben?.
Wenn Sie BigQuery zum ersten Mal verwenden, führen Sie die folgenden Schritte aus, um ein Projekt einzurichten:
- Gehen Sie in der Google Cloud Console zu Projekt erstellen.
- Geben Sie Ihrem neuen Projekt einen Namen wie „Mein Chrome-UX-Bericht“ und klicken Sie auf „Erstellen“.
- Geben Sie Ihre Zahlungsinformationen an, wenn Sie dazu aufgefordert werden.
- Rufen Sie das CrUX-Dataset in BigQuery auf.
Jetzt können Sie mit dem Abfragen des Datasets beginnen.
Projektorganisation
CrUX-Daten in BigQuery werden am zweiten Dienstag des Folgemonats veröffentlicht. Jeder Monat wird als neue Tabelle unter chrome-ux-report.all
veröffentlicht. Außerdem stehen eine Reihe von materialisierten Tabellen mit zusammenfassenden Statistiken für jeden Monat zur Verfügung.
- „chrome-ux-report“
Detailliertes Tabellenschema
Die Rohtabellen für jedes Land und das Dataset all
werden nach Jahr und Monat angegeben.
Rohdatentabellen
Die Rohtabellen haben das folgende Schema:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schema einer materialisierten Tabelle
Materialisierte Tabellen werden für einen einfacheren Zugriff auf Übersichtsdaten anhand einer Reihe von Schlüsseldimensionen bereitgestellt. Es stehen keine Histogramme zur Verfügung. Stattdessen werden Leistungsdaten anhand der Leistungsbewertung und des 75. Perzentils in Bruchteilen zusammengefasst. Das folgende Beispiel zeigt eine Reihe von Beispielzeilen aus der Tabelle metrics_summary
:
jjjjmm | Ursprung | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1.600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1.400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0.0284 | 1.500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1.500 |
Das zeigt, dass im Datensatz für 20204 90,56% der tatsächlichen Nutzererfahrung auf https://example.com
die Kriterien für einen guten LCP erfüllten und dass der grobe LCP-Wert im 75. Perzentil 1.600 ms betrug. Das ist etwas langsamer als in den vorherigen Monaten.
Es stehen vier materialisierte Tabellen zur Verfügung:
metrics_summary
- wichtige Messwerte nach Monat und Ursprung
device_summary
- wichtige Messwerte nach Monat, Ursprung und Gerätetyp
country_summary
- wichtige Messwerte nach Monat, Ursprung, Gerätetyp und Land
origin_summary
- eine Liste aller Ursprünge im Dataset
metrics_summary
Die Tabelle metrics_summary
enthält zusammenfassende Statistiken für jeden Ursprung und jedes monatliche Dataset:
yyyymm
- Monat des Datenerhebungszeitraums
origin
- URL der Websiteursprung
rank
- Ranking aufgrund grober Beliebtheit (Stand: März 2021)
[small|medium|large]_cls
- Anteil des Traffics nach CLS-Grenzwerten
[fast|avg|slow]_<metric>
- Anteil der Zugriffe nach Leistungsgrenzwerten
p75_<metric>
- Wert der Leistungsmesswerte für 75. Perzentil (Millisekunden)
notification_permission_[accept|deny|ignore|dismiss]
- Anteil der Verhaltensweisen von Benachrichtigungsberechtigungen
[desktop|phone|tablet]Density
- Anteil der Zugriffe nach Formfaktor
[_4G|_3G|_2G|slow2G|offline]Density
- Anteil des Traffics nach effektivem Verbindungstyp
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- Anteil der Navigationstypen
device_summary
Die Tabelle „device_summary
“ enthält zusammengefasste Statistiken nach Monat, Ursprung, Land und Gerät. Zusätzlich zu den metrics_summary
-Spalten gibt es:
device
- Formfaktor des Geräts
country_summary
Die Tabelle „country_summary
“ enthält zusammengefasste Statistiken nach Monat, Ursprung, Land und Gerät. Zusätzlich zu den metrics_summary
-Spalten gibt es:
country_code
- Ländercode mit zwei Buchstaben
device
- Formfaktor des Geräts
origin_summary
Die Tabelle origin_summary
enthält eine Liste aller Ursprünge im CrUX-Dataset. Sie wird monatlich mit der neuesten Liste von Ursprüngen im Dataset aktualisiert und hat nur eine Spalte: origin
.
Experimentelles Dataset
Die Tabellen im experimentellen Dataset sind exakte Kopien der YYYYMM
-Standardtabellen. Sie verwenden jedoch neuere und erweiterte BigQuery-Funktionen wie Partitionierung und Clustering, mit denen Sie schnellere, einfachere und kostengünstigere Abfragen schreiben können.
country
Das Dataset experimental.country
enthält aggregierte Daten aus den country_CC
-Datasets mit einer zusätzlichen yyyymm
-Spalte für das Dataset-Datum. Das Schema ist identisch mit Rohtabellen, wobei die Spalten „Datum“ und „country_code
“ hinzugefügt wurden. Dadurch können Abfragen auf Länderebene über einen bestimmten Zeitraum verglichen werden, ohne dass die monatlichen Tabellen zusammengeführt werden.
global
Das Dataset experimental.global
enthält aggregierte Daten aus dem Dataset all
mit einer zusätzlichen yyyymm
-Spalte für das Dataset-Datum. Das Schema ist identisch mit Rohtabellen (nur das Datum), sodass Abfragen über einen längeren Zeitraum verglichen werden können, ohne die monatlichen Tabellen zu verknüpfen.