Raport na temat użytkowania Chrome w BigQuery

Dowiedz się więcej o strukturze danych raportu na temat użytkowania Chrome w BigQuery.

Wstęp

Nieprzetworzone dane raportu na temat użytkowania Chrome (CrUX) są dostępne w BigQuery – bazie danych hostowanej w Google Cloud.

Raport CrUX w BigQuery umożliwia użytkownikom bezpośrednie wysyłanie zapytań o pełny zbiór danych od 2017 roku, na przykład w celu analizowania trendów, porównywania technologii internetowych lub testów porównawczych.

Dane są uporządkowane według wersji miesięcznych, a także tabel podsumowania, które zapewniają łatwy dostęp do zapytań dotyczących danych.

Dane BigQuery są podstawą panelu CrUX, który umożliwia wizualizację tych danych bez konieczności pisania zapytań SQL.

Dostęp do zbioru danych

Aby korzystać z BigQuery, musisz mieć konto Google Cloud i podstawową znajomość SQL. Do zbioru danych na temat użytkowania Chrome w BigQuery można bezpłatnie korzystać z naszego poziomu bezpłatnego, który jest odnawiany co miesiąc i dostarczany przez BigQuery. Dodatkowo nowi użytkownicy Google Cloud mogą kwalifikować się do otrzymania kwoty rejestracyjnej, która pokryje wydatki wykraczające poza poziom bezpłatny. Pamiętaj, że do projektu Google Cloud wymagana jest karta kredytowa. Przeczytaj artykuł Dlaczego muszę podać kartę kredytową?.

Jeśli po raz pierwszy używasz BigQuery, wykonaj te czynności, aby skonfigurować projekt:

  1. Przejdź do opcji Utwórz projekt w konsoli Google Cloud.
  2. Nadaj nowemu projektowi nazwę, na przykład „Mój raport na temat użytkowania Chrome” i kliknij Utwórz.
  3. Jeśli pojawi się taka prośba, podaj informacje rozliczeniowe.
  4. Otwórz zbiór danych raportu na temat użytkowania Chrome w BigQuery.

Możesz teraz zacząć tworzyć zapytania dotyczące zbioru danych.

Organizacja projektu

Dane raportu CrUX w BigQuery są udostępniane w drugi wtorek następnego miesiąca. Co miesiąc jest udostępniana jako nowa tabela w kolumnie chrome-ux-report.all. Dostępnych jest również wiele tabel zmaterializowanych, które zawierają podsumowania statystyk za każdy miesiąc.

Szczegółowy schemat tabeli

Tabele nieprzetworzone dla każdego kraju i zbioru danych all są podawane według roku i miesiąca.

Tabele nieprzetworzone

Nieprzetworzone tabele mają ten schemat:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schemat tabeli zmaterializowanej

Tabele zmaterializowane ułatwiają dostęp do danych podsumowujących według kilku kluczowych wymiarów. Nie udostępniamy histogramów. Dane o skuteczności są agregowane w ułamki według oceny skuteczności i wartości 75 centyla. W tym przykładzie pokazano zbiór przykładowych wierszy z tabeli metrics_summary:

rrrrmm pochodzenie fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Pokazuje to, że w zbiorze danych z 20204 r.90, 56% rzeczywistych doświadczeń użytkownika w aplikacji https://example.com spełniało kryteria dobrego LCP,a przybliżona wartość LCP na 75 centylu wynosi 1600 ms. Trwa to nieco dłużej niż w poprzednich miesiącach.

Dostępne są 4 tabele zmaterializowane:

metrics_summary
kluczowe dane według miesiąca i źródła
device_summary
najważniejsze dane według miesiąca, źródła i typu urządzenia
country_summary
kluczowe dane według miesiąca, pochodzenia, typu urządzenia i kraju
origin_summary
listę wszystkich źródeł uwzględnionych w zbiorze danych.

metrics_summary

Tabela metrics_summary zawiera statystyki podsumowujące dla każdego źródła i każdego miesięcznego zbioru danych:

yyyymm
Miesiąc, w którym zebrano dane
origin
URL źródła witryny
rank
Przybliżona pozycja w rankingu popularności (dane z marca 2021 r.)
[small|medium|large]_cls
ułamek ruchu według progów CLS
[fast|avg|slow]_<metric>
ułamek ruchu według progów skuteczności
p75_<metric>
75. percentyl danych o skuteczności (milisekundy)
notification_permission_[accept|deny|ignore|dismiss]
ułamek zachowań związanych z powiadomieniami
[desktop|phone|tablet]Density
ułamek ruchu według formatu
[_4G|_3G|_2G|slow2G|offline]Density
ułamek ruchu według efektywnego typu połączenia
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
ułamek typów nawigacji

device_summary

Tabela device_summary zawiera zbiorcze statystyki według miesiąca, pochodzenia, kraju i urządzenia. Oprócz kolumn metrics_summary dostępne są następujące informacje:

device
Format urządzenia

country_summary

Tabela country_summary zawiera zbiorcze statystyki według miesiąca, pochodzenia, kraju i urządzenia. Oprócz kolumn metrics_summary dostępne są następujące informacje:

country_code
Dwuliterowy kod kraju
device
Format urządzenia

origin_summary

Tabela origin_summary zawiera listę wszystkich źródeł w zbiorze danych CrUX. Jest aktualizowana co miesiąc o najnowszą listę źródeł w zbiorze danych i zawiera jedną kolumnę: origin.

Eksperymentalny zbiór danych

Tabele w eksperymentalnym zbiorze danych są dokładnymi kopiami domyślnych tabel YYYYMM, ale korzystają z nowszych i bardziej zaawansowanych funkcji BigQuery, takich jak partycjonowanie i klastrowanie, które pozwalają tworzyć szybsze, prostsze i tańsze zapytania.

country

Zbiór danych experimental.country zawiera dane zbiorcze ze zbiorów danych country_CC z dodatkową kolumną yyyymm dla daty zbioru danych. Schemat jest taki sam jak tabele nieprzetworzone, z tym, że zawiera kolumnę daty i country_code, co umożliwia porównanie danych na poziomie kraju w ujęciu czasowym bez konieczności złączania tabel miesięcznych.

global

Zbiór danych experimental.global zawiera dane zbiorcze ze zbioru danych all z dodatkową kolumną yyyymm dla daty zbioru danych. Schemat jest taki sam jak tabele nieprzetworzone z uwzględnieniem daty, co pozwala na porównywanie zapytań w czasie bez złączania tabel miesięcznych.