Добавление величины рейтинга в отчет CrUX в BigQuery

Начиная с набора данных за февраль 2021 года , мы добавляем в отчет CrUX в BigQuery экспериментальную метрику, которая различает популярность источников по порядку: 1 тысяча лучших источников, 10 тысяч лучших, 100 тысяч лучших, 1 миллион лучших...

Давайте посмотрим, как это выглядит на практике:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Ряд ранг_величина num_origins
1 1000 1000
2 10 000 9000
3 100 000 90 000
4 1 000 000 900 000
15 10 000 000 7 264 371

Для глобального набора данных за февраль 2021 года мы получаем 5 сегментов. Как и ожидалось, в строке 1 мы видим 1000 источников с рангом 1000 — это 1 тысяча самых популярных источников по нашей метрике. Строка 2 может показаться неожиданной, поскольку указывает на то, что в наборе из 10 тысяч лучших источников только 9 тысяч; это связано с тем, что исходные точки в строке 1 также являются частью набора 10 000 лучших. Чтобы выбрать 10 тысяч лучших источников, при запросе необходимо указать Experiment.popularity.rank <= 10000.

Набор данных также содержит рейтинговую величину для конкретной страны. Например, этот запрос перечисляет 10 000 источников, которые наиболее популярны в Германии.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Чтобы коснуться потенциала нашей новой метрики популярности, давайте посмотрим, как сегменты популярности в сети различаются по отношению к первой метрике рисования контента (FCP) . Для целей этого запроса мы считаем 1 секунду быстрым взаимодействием с пользователем.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

Для источников с experimental.popularity.rank <= 1000 запрос суммирует все плотности сегментов гистограммы для значений метрик FCP менее 1000 мс и делит ее на количество источников, то есть вычисляет средний процент быстрых загрузок FCP для 1к самых популярных источников. В этом запросе все источники имеют одинаковый вес, поэтому, возможно, это не идеально. Но давайте посмотрим, чувствителен ли результат к изменению величины ранга, изменив предложениеwhere, указав Experiment.popularity.rank <= 10000. Мы делаем это для 10 000, 100 000 и т. д.:

Ранговая величина происхождения Процент FCP < 1 с, усредненный по источникам
1.000 53,6%
10 000 49,6%
100 000 45,9%
1 000 000 43,2%
10 000 000 39,9%

Это указывает на то, что более быстрый пользовательский опыт в Интернете коррелирует с большей популярностью.

В наборе данных за октябрь 2022 года это было дополнительно разделено на половинные ступени. Повторный запуск первого запроса для этого набора данных показывает полушаги и количество источников в каждой величине ранга:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Ряд ранг_величина num_origins
1 1000 1000
2 5000 4000
3 10 000 5000
4 50 000 40 000
5 100 000 50 000
6 500 000 400 000
7 1 000 000 500 000
8 5 000 000 4 000 000
9 10 000 000 5 000 000
10 50 000 000 7 637 195

Узнайте больше об использовании CrUX в BigQuery и просмотрите кулинарную книгу CrUX, чтобы найти больше примеров запросов. Поделитесь своими запросами, если хотите, и дайте нам знать, что вы найдете.