Dodanie wartości rankingu do raportu na temat użytkowania Chrome w BigQuery

Zaczynając od zbioru danych z lutego 2021 r., dodajemy do raportu CRUX w BigQuery dane eksperymentalne, które rozróżniają popularność źródeł pod względem wielkości: 1000 najpopularniejszych źródeł, 10 tys. najpopularniejszych źródeł, 100 tys. najpopularniejszych źródeł, …

Zobaczmy, jak to działa w praktyce:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 10 000 9000
3 100 000 90 000
4 1 000 000 900 000
15 10 000 000 7 264 371

W przypadku globalnego zbioru danych z lutego 2021 r. mamy 5 grup. Zgodnie z oczekiwaniami w wierszu 1 widzimy, że jest 1000 punktów docelowych o wielkości 1000 – czyli 1000 najpopularniejszych punktów docelowych według naszych danych. Wiersz 2 może wydawać się zaskakujący, ponieważ wskazuje, że w zbiorze 10 000 najlepszych źródeł jest tylko 9 tys. źródeł. Dzieje się tak, ponieważ źródła w wierszu 1 również należą do zbioru 10 000 najlepszych źródeł. Aby wybrać 10 najpopularniejszych źródeł, należy w zapytaniu podać experimental.popularity.rank <= 10000.

Zbiór danych zawiera też wielkość rankingu w poszczególnych krajach. Na przykład to zapytanie zawiera listę 10 tysięcy miejsc pochodzenia, które są najpopularniejsze w Niemczech.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Aby pokazać potencjał naszego nowego wskaźnika popularności, przyjrzyjmy się, jak różnią się segmenty popularności w internecie pod względem wskaźnika pierwszego wyrenderowania treści (FCP). Na potrzeby tego zapytania 1 sekundę uznajemy za szybkie działanie.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

W przypadku źródeł o wartości experimental.popularity.rank <= 1000 zapytanie zlicza wszystkie gęstości zbiorników histogramu dla wartości danych FCP mniejszych niż 1000 ms i dzieli je przez liczbę źródeł – innymi słowy, oblicza średniy odsetek szybkich wczytań FCP dla 1000 najpopularniejszych źródeł. W tym zapytaniu wszystkie źródła mają równą wagę, więc nie jest to idealne rozwiązanie. Sprawdźmy jednak, czy wynik jest wrażliwy na zmianę wielkości rankingu. Aby to zrobić, zmień klauzulę where, aby określić experimental.popularity.rank <= 10000. Robimy to w przypadku 10 tys., 100 tys. i tak dalej:

Wielkość rankingu źródeł Odsetek przypadków FCP < 1 s, uśredniony na podstawie źródeł
1,000  53,6%
10 000 49,6%
100 000 45,9%
1 000 000 43,2%
10 000 000 39,9%

Oznacza to, że szybsze działanie stron internetowych wiąże się z większą popularnością.

zbiorze danych z października 2022 r. te dane zostały dodatkowo podzielone na kroki o połowie pozycji. Ponowne uruchomienie pierwszego zapytania dotyczącego tego zbioru danych pokazuje półkroki i liczbę źródeł w każdej wielkości rangi:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 5000 4000
3 10 000 5000
4 50 000 40 000
5 100 000 50 000
6 500 000 400 000
7 1 000 000 500 000
8 5 000 000 4 000 000
9 10 000 000 5 000 000
10 50 000 000 7,637,195

Dowiedz się więcej o używaniu CrUX w BigQuery i zapoznaj się z Poradnikiem dotyczącym CrUX, aby zobaczyć więcej przykładowych zapytań. Jeśli chcesz, możesz udostępnić nam swoje zapytania i poinformować nas o wynikach.