Эта страница переведена с помощью Cloud Translation API.

Crux в BigQuery

Узнайте, как структурированы данные CrUX в BigQuery.

Введение

Необработанные данные для отчета Chrome UX Report (CrUX) доступны в BigQuery — базе данных, размещенной в Google Cloud.

CrUX на BigQuery позволяет пользователям напрямую запрашивать полный набор данных, начиная с 2017 года, например, для анализа тенденций, сравнения веб-технологий и сравнительного анализа доменов.

Данные структурированы по ежемесячным выпускам, а также содержат ряд сводных таблиц для обеспечения более быстрого доступа для запросов к данным.

Данные BigQuery лежат в основе панели мониторинга CrUX , которая позволяет визуализировать эти данные без написания SQL-запросов.

Доступ к набору данных

Для использования BigQuery требуется учётная запись Google Cloud и базовые знания SQL. Набор данных CrUX в BigQuery доступен для бесплатного доступа и изучения в пределах бесплатного уровня , который ежемесячно продлевается и предоставляется BigQuery. Кроме того, новые пользователи Google Cloud могут получить регистрационный кредит для покрытия расходов, превышающих бесплатный уровень. Обратите внимание, что для проекта Google Cloud необходимо предоставить данные кредитной карты. См. раздел «Зачем нужна кредитная карта?» .

Если вы впервые используете BigQuery, выполните следующие действия для настройки проекта:

Перейдите в раздел «Создать проект» на консоли Google Cloud .
Дайте новому проекту имя, например «Мой отчет Chrome UX», и нажмите «Создать».
При необходимости укажите платежные данные.
Перейдите к набору данных CrUX в BigQuery.

Теперь вы готовы начать выполнять запросы к набору данных.

Организация проекта

Данные CrUX в BigQuery публикуются во второй вторник следующего месяца. Каждый месяц публикуются в виде новой таблицы в chrome-ux-report.all . Также существует ряд материализованных таблиц, содержащих сводную статистику за каждый месяц.

`chrome-ux-report
- all
  - ГГГГММ
- country_CC
  - ГГГГММ
- experimental
  - country
  - global
- materialized

Подробная схема таблицы

Необработанные таблицы для каждой страны и all наборы данных предоставляются по годам и месяцам.

Необработанные таблицы

Необработанные таблицы имеют следующую схему:

origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
- cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
- navigate
- navigate_cache
- reload
- restore
- back_forward
- back_forward_cache
- prerender
experimental
- permission
  - notifications
- time_to_first_byte
- popularity

Схема материализованной таблицы

Материализованные таблицы предназначены для упрощения доступа к сводным данным по ряду ключевых измерений. Гистограммы не предоставляются, вместо этого данные о производительности агрегируются в доли по оценке производительности и значению 75-го процентиля. В этом примере показан набор строк из таблицы metrics_summary :

ггггмм	источник	fast_lcp	avg_lcp	slow_lcp	p75_lcp
202204	https://example.com	0,9056	0,0635	0,0301	1600
202203	https://example.com	0,9209	0,052	0,0274	1400
202202	https://example.com	0,9169	0,0545	0,0284	1500
202201	https://example.com	0,9072	0,0626	0,0298	1500

Это показывает, что в наборе данных 202204 года 90,56% реальных пользовательских впечатлений от https://example.com соответствовали критериям хорошего LCP , а приблизительное значение LCP 75-го процентиля составило 1600 мс. Это немного медленнее, чем в предыдущие месяцы.

Предоставляются четыре материализованные таблицы:

metrics_summary: ключевые показатели по месяцам и происхождению
device_summary: ключевые показатели по месяцам, происхождению и типу устройства
country_summary: ключевые показатели по месяцам, происхождению, типу устройства и стране
origin_summary: список всех источников, включенных в набор данных

`metrics_summary`

Таблица metrics_summary содержит сводную статистику для каждого источника и каждого ежемесячного набора данных:

yyyymm: Месяц периода сбора данных
origin: URL-адрес исходного сайта
rank: Грубый рейтинг популярности (по состоянию на март 2021 г. )
[small|medium|large]_cls: доля трафика по порогам CLS
[fast|avg|slow]_<metric>: доля трафика по пороговым значениям производительности
[low|medium|high]_rtt: доля трафика по порогам RTT
p75_<metric>: 75-й процентиль показателя производительности (миллисекунды)
notification_permission_[accept|deny|ignore|dismiss]: доля поведения разрешения уведомлений
[desktop|phone|tablet]Density: доля трафика по форм-фактору
[_4G|_3G|_2G|slow2G|offline]Density: Доля трафика по эффективному типу соединения (рассчитано на основе гистограмм rtt с февраля 2025 г. , без офлайн-подключений)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]: доля типов навигации

`device_summary`

Таблица device_summary содержит агрегированную статистику по месяцам, странам происхождения и устройствам. Помимо столбцов metrics_summary здесь есть:

device: Форм-фактор устройства

`country_summary`

Таблица country_summary содержит агрегированную статистику по месяцам, странам происхождения и устройствам. Помимо столбцов metrics_summary здесь также есть:

country_code: Двухбуквенный код страны
device: Форм-фактор устройства

`origin_summary`

Таблица origin_summary содержит список всех источников в наборе данных CrUX; она ежемесячно обновляется последним списком источников в наборе данных и имеет один столбец: origin .

Экспериментальный набор данных

Таблицы в экспериментальном наборе данных являются точными копиями таблиц YYYYMM по умолчанию, но они используют более новые и продвинутые функции BigQuery, такие как разбиение на разделы и кластеризация , которые позволяют писать более быстрые, простые и дешевые запросы.

`country`

Набор данных experimental.country содержит агрегированные данные из наборов данных country_CC с дополнительным столбцом yyyymm для даты набора данных. Схема идентична схеме необработанных таблиц, но с добавлением столбцов date и country_code , что позволяет выполнять запросы для сравнения данных по странам с течением времени без объединения ежемесячных таблиц.

`global`

Набор данных experimental.global содержит агрегированные данные из all набора данных с дополнительным столбцом yyyymm для даты набора данных. Схема идентична схеме необработанных таблиц с добавлением даты, что позволяет выполнять запросы для сравнения данных во времени без объединения ежемесячных таблиц.

Crux в BigQuery Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.