Dodanie wartości rankingu do raportu na temat użytkowania Chrome w BigQuery

Począwszy od zbioru danych z lutego 2021 r. do raportu na temat użytkowania Chrome w BigQuery dodaliśmy dane eksperymentalne, które pozwalają rozróżnić popularność źródeł według rzędu wielkości: 1 tys. najlepszych źródeł, najlepsze 10 tys., najlepsze 100 tys., najlepsze 1 mln najlepszych źródeł...

Zobaczmy, jak to działa w praktyce:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 10 000 9000
3 100 000 90 000
4 1 000 000 900 000
15 10 000 000 7 264 371

W przypadku globalnego zbioru danych z lutego 2021 r. mamy 5 grup. Zgodnie z oczekiwaniami w wierszu 1 widzimy, że jest 1000 punktów docelowych o wielkości 1000 – czyli 1000 najpopularniejszych punktów docelowych według naszych danych. Wiersz 2 może być zaskakujący, ponieważ wskazuje, że w zbiorze 10 000 najlepszych źródeł jest tylko 9 tys. źródeł. Dzieje się tak, ponieważ źródła w wierszu 1 również należą do zbioru 10 000 najlepszych źródeł. Aby wybrać 10 najpopularniejszych źródeł, należy w zapytaniu podać experimental.popularity.rank <= 10000.

Zbiór danych zawiera też wielkość rankingu w poszczególnych krajach. Na przykład to zapytanie zawiera listę 10 tysięcy miejsc pochodzenia, które są najpopularniejsze w Niemczech.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Aby poruszyć potencjał naszego nowego wskaźnika popularności, zobaczmy, jak różne segmenty popularności w internecie różnią się w odniesieniu do pierwszego wyrenderowania treści. Na potrzeby tego zapytania 1 sekundę uznajemy za szybkie działanie.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

W przypadku źródeł o wartości experimental.popularity.rank <= 1000 zapytanie zlicza wszystkie gęstości zbiorników histogramu dla wartości danych FCP mniejszych niż 1000 ms i dzieli je przez liczbę źródeł – innymi słowy, oblicza średniy odsetek szybkich wczytań FCP dla 1000 najpopularniejszych źródeł. W tym zapytaniu wszystkie źródła mają równą wagę, więc nie jest to idealne rozwiązanie. Zobaczmy jednak, czy wynik ma wpływ na zmianę wielkości rankingu, zmieniając klauzulę „where” w taki sposób, aby określała wartość Experiment.popularity.rank <= 10000. Robimy to dla 10 tys., 100 tys. itd.:

Wielkość rankingu źródeł Odsetek FCP < 1, uśredniony według źródeł
1,000  53,6%
10 000 49,6%
100 000 45,9%
1 000 000 43,2%
10 000 000 39,9%

Oznacza to, że szybsze działanie stron internetowych wiąże się z większą popularnością.

zbiorze danych z października 2022 r. te dane zostały dodatkowo podzielone na kroki o połowie pozycji. Ponowne uruchomienie pierwszego zapytania dotyczącego tego zbioru danych pokazuje półkroki i liczbę źródeł w każdej wielkości rangi:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 5000 4000
3 10 000 5000
4 50 000 40 000
5 100 000 50 000
6 500 000 400 000
7 1 000 000 500 000
8 5 000 000 4 000 000
9 10 000 000 5 000 000
10 50 000 000 7,637,195

Dowiedz się więcej o używaniu CrUX w BigQuery i zapoznaj się z Poradnikiem dotyczącym CrUX, aby zobaczyć więcej przykładowych zapytań. Jeśli chcesz, możesz udostępnić nam swoje zapytania i poinformować nas o wynikach.