Dowiedz się, jak dane z tego pliku są ustrukturyzowane w BigQuery.
Wprowadzenie
Dane nieprzetworzone, na których opiera się raport UX Chrome (CrUX), są dostępne w BigQuery, czyli w bazie danych hostowanej w Google Cloud.
CrUX w BigQuery umożliwia użytkownikom bezpośrednie wysyłanie zapytań do pełnego zbioru danych obejmującego dane z lat 2017 i wcześniej, np. w celu analizowania trendów, porównywania technologii internetowych i porównywania domen.
Dane są uporządkowane według miesięcznej wersji, a także w formie kilku tabel podsumowania, które ułatwiają wykonywanie dotyczących ich zapytań.
Dane z BigQuery stanowią podstawę panelu Crux, który umożliwia wizualizację tych danych bez konieczności pisania zapytań SQL.
Dostęp do zbioru danych
Korzystanie z BigQuery wymaga konta Google Cloud i podstawowej znajomości języka SQL. Dostęp do zbioru danych na temat użytkowania Chrome w BigQuery jest bezpłatny. Możesz go przeglądać i poznawać w ramach poziomu bezpłatnego, który jest odnawiany co miesiąc i dostarczany przez BigQuery. Oprócz tego nowi użytkownicy Google Cloud mogą kwalifikować się do otrzymania środków na rejestrację, które pokryją wydatki wykraczające poza poziom bezpłatny. Pamiętaj, że na potrzeby projektu Google Cloud należy podać kartę kredytową. Więcej informacji znajdziesz w artykule Dlaczego muszę podać kartę kredytową?.
Jeśli korzystasz z BigQuery po raz pierwszy, wykonaj te czynności, aby skonfigurować projekt:
- W konsoli Google Cloud kliknij Utwórz projekt.
- Nadaj nowemu projektowi nazwę, np. „Mój raport UX w Chrome”, i kliknij Utwórz.
- Podaj informacje rozliczeniowe, jeśli pojawi się taka prośba.
- Otwórz w BigQuery zbiór danych CRUX.
Teraz możesz zacząć tworzyć zapytania dotyczące zbioru danych.
Organizacja projektu
Dane na temat użytkowania Chrome w BigQuery są udostępniane w drugi wtorek następnego miesiąca. Każdy miesiąc jest udostępniany jako nowa tabela w subskrypcji chrome-ux-report.all
. Dostępne są też liczne zmaterializowane tabele, które zawierają podsumowanie statystyk za każdy miesiąc.
- `chrome-ux-report
Szczegółowy schemat tabeli
Tabele nieprzetworzone dla poszczególnych krajów i zbiór danych all
są podawane według roku i miesiąca.
Tabele nieprzetworzone
Tabele nieprzetworzone mają ten schemat:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schemat tabeli zmaterializowanej
Tabela zagregowana jest udostępniana, aby ułatwić dostęp do danych podsumowania według kilku kluczowych wymiarów. Nie podano histogramów. Dane o wydajności są natomiast agregowane do ułamków według oceny wydajności i wartości 75 centyla. W tym przykładzie pokazano kilka przykładowych wierszy z tabeli metrics_summary
:
rrrrmm | pochodzenie | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
To pokazuje, że w zbiorze danych z 202204 r. 90, 56% rzeczywistych użytkowników https://example.com
spełniało kryteria dobrego LCP,a przybliżona wartość LCP w 75. percentylu wynosiła 1600 ms. To nieco wolniejsze tempo niż w poprzednich miesiącach.
Dostępne są cztery tabele zmaterializowane:
metrics_summary
- kluczowe dane według miesiąca i źródła
device_summary
- kluczowe dane według miesiąca, źródła i typu urządzenia
country_summary
- kluczowe dane według miesiąca, pochodzenia, typu urządzenia i kraja
origin_summary
- lista wszystkich źródeł zawartych w zbiorze danych
metrics_summary
Tabela metrics_summary
zawiera statystyki podsumowujące dotyczące każdego źródła i każdego miesięcznego zbioru danych:
yyyymm
- Miesiąc okresu gromadzenia danych
origin
- Adres URL pochodzenia witryny
rank
- Przybliżony ranking popularności (na marzec 2021 r.)
[small|medium|large]_cls
- ułamek ruchu według progów CLS
[fast|avg|slow]_<metric>
- ułamek ruchu według progów skuteczności
p75_<metric>
- Wartość 75. percentyla danych o skuteczności (milisekundy)
notification_permission_[accept|deny|ignore|dismiss]
- ułamek przypadków, w których użytkownicy uzyskali zgodę na wyświetlanie powiadomień
[desktop|phone|tablet]Density
- ułamek ruchu według formatu
[_4G|_3G|_2G|slow2G|offline]Density
- Udział ruchu według typu połączenia
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- ułamek typów nawigacji
device_summary
Tabela device_summary
zawiera zbiorcze statystyki według miesiąca, pochodzenia, kraju i urządzenia. Oprócz kolumn metrics_summary
dostępne są:
device
- Format urządzenia
country_summary
Tabela country_summary
zawiera zbiorcze statystyki według miesiąca, pochodzenia, kraju i urządzenia. Oprócz kolumn metrics_summary
dostępne są:
country_code
- Dwuliterowy kod kraju
device
- Format urządzenia
origin_summary
Tabela origin_summary
zawiera listę wszystkich źródeł w zbiorze danych CrUX. Jest ona aktualizowana co miesiąc o najnowszą listę źródeł w zbiorze danych i zawiera jedną kolumnę: origin
.
Eksperymentalny zbiór danych
Tabele w eksperymentalnym zbiorze danych są dokładnymi kopiami domyślnych tabel YYYYMM
, ale korzystają z nowszych i bardziej zaawansowanych funkcji BigQuery, takich jak partycjonowanie i zagnieżdżanie, które umożliwiają tworzenie szybszych, prostszych i tańszych zapytań.
country
Zbiór danych experimental.country
zawiera zagregowane dane ze zbiorów danych country_CC
z dodatkową kolumną yyyymm
z datą zbioru danych. Schemat jest identyczny jak w tabelach nieprzetworzonych, ale zawiera kolumny data i country_code
, co umożliwia porównywanie danych na poziomie kraju w ciągu czasu bez złączania tabel miesięcznych.
global
Zbiór danych experimental.global
zawiera dane zbiorcze ze zbioru danych all
z dodatkową kolumną yyyymm
dla daty zbioru danych. Schemat jest identyczny jak w tabelach surowych, ale zawiera datę, co umożliwia wykonywanie zapytań porównawczych w czasie bez złączania tabel miesięcznych.