CrUX en BigQuery

Obtén información sobre cómo se estructuran los datos de CrUX en BigQuery.

Introducción

Los datos sin procesar del informe de UX de Chrome (CrUX) están disponibles en BigQuery, una base de datos alojada en Google Cloud.

CrUX en BigQuery permite a los usuarios consultar directamente el conjunto de datos completo desde 2017, por ejemplo, para analizar tendencias, comparar tecnologías web y comparar dominios.

Los datos se estructuran por lanzamiento mensual, así como por varias tablas de resumen para proporcionar un acceso sencillo para consultar los datos.

Los datos de BigQuery son la base del panel de CrUX, que te permite visualizar estos datos sin escribir consultas de SQL.

Cómo acceder al conjunto de datos

Para usar BigQuery, necesitas una cuenta de Google Cloud y conocimientos básicos de SQL. Puedes acceder al conjunto de datos de CrUX en BigQuery y explorarlo hasta alcanzar los límites del nivel gratuito, que se renueva mensualmente y proporciona BigQuery. Además, es posible que los usuarios nuevos de Google Cloud sean aptos para obtener un crédito de registro para cubrir los gastos más allá del nivel gratuito. Ten en cuenta que se debe proporcionar una tarjeta de crédito para el proyecto de Google Cloud. Consulta ¿Por qué debo proporcionar una tarjeta de crédito?.

Si es la primera vez que usas BigQuery, sigue estos pasos para configurar un proyecto:

  1. Navega a Crear un proyecto en la consola de Google Cloud.
  2. Asigna un nombre a tu proyecto nuevo, como "Mi informe de UX de Chrome", y haz clic en Crear.
  3. Proporciona tus datos de facturación si se te solicita.
  4. Navega al conjunto de datos de CrUX en BigQuery.

Ahora está todo listo para que comiences a consultar el conjunto de datos.

Organización del proyecto

Los datos de CrUX en BigQuery se publican el segundo martes del mes siguiente. Cada mes se publica como una tabla nueva en chrome-ux-report.all. También hay varias tablas materializadas que proporcionan estadísticas de resumen para cada mes.

Esquema detallado de la tabla

Las tablas sin procesar de cada país y el conjunto de datos all se proporcionan por año y mes.

Tablas sin procesar

Las tablas sin procesar tienen el siguiente esquema:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Esquema de tabla materializada

Las tablas materializadas se proporcionan para facilitar el acceso a los datos de resumen por varias dimensiones clave. No se proporcionan histogramas. En su lugar, los datos de rendimiento se agregan en fracciones según la evaluación del rendimiento y el valor del percentil 75. En este ejemplo, se muestra un conjunto de filas de ejemplo de la tabla metrics_summary:

aaaamm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

Esto muestra que, en el conjunto de datos de 202204, el 90.56% de las experiencias de usuarios reales en https://example.com cumplía con los criterios de buen LCP y que el valor de LCP del percentil 75 aproximado fue de 1,600 ms. Esto es un poco más lento que en meses anteriores.

Se proporcionan cuatro tablas materializadas:

metrics_summary
métricas clave por mes y origen
device_summary
métricas clave por mes, origen y tipo de dispositivo
country_summary
métricas clave por mes, origen, tipo de dispositivo y país
origin_summary
una lista de todos los orígenes incluidos en el conjunto de datos

metrics_summary

La tabla metrics_summary contiene estadísticas de resumen para cada origen y cada conjunto de datos mensual:

yyyymm
Mes del período de recopilación de datos
origin
URL del origen del sitio
rank
Clasificación de popularidad general (a partir de marzo de 2021)
[small|medium|large]_cls
Fracción de tráfico por umbrales de CLS
[fast|avg|slow]_<metric>
Fracción de tráfico por umbrales de rendimiento
p75_<metric>
Valor del percentil 75 de las métricas de rendimiento (milésimas de segundo)
notification_permission_[accept|deny|ignore|dismiss]
Fracción de comportamientos de permisos de notificaciones
[desktop|phone|tablet]Density
Fracción de tráfico por factor de forma
[_4G|_3G|_2G|slow2G|offline]Density
Fracción de tráfico por tipo de conexión real
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
Fracción de tipos de navegación

device_summary

La tabla device_summary contiene estadísticas agregadas por mes, origen, país y dispositivo. Además de las columnas metrics_summary, se incluye lo siguiente:

device
Factor de forma
del dispositivo

country_summary

La tabla country_summary contiene estadísticas agregadas por mes, origen, país y dispositivo. Además de las columnas metrics_summary, se incluye lo siguiente:

country_code
Código de país de dos letras
device
Factor de forma
del dispositivo

origin_summary

La tabla origin_summary contiene una lista de todos los orígenes del conjunto de datos de CrUX. Se actualiza mensualmente con la lista más reciente de orígenes del conjunto de datos y tiene una sola columna: origin.

Conjunto de datos experimental

Las tablas del conjunto de datos experimental son copias exactas de las tablas YYYYMM predeterminadas, pero usan funciones de BigQuery más nuevas y avanzadas, como el particionado y el agrupamiento en clústeres, que te permiten escribir consultas más rápidas, simples y económicas.

country

El conjunto de datos experimental.country contiene datos agregados de los conjuntos de datos country_CC con una columna yyyymm adicional para la fecha del conjunto de datos. El esquema es idéntico al de las tablas sin procesar, con la adición de las columnas fecha y country_code, lo que permite que se ejecuten consultas de comparación a nivel del país a lo largo del tiempo sin unir las tablas mensuales.

global

El conjunto de datos experimental.global contiene datos agregados del conjunto de datos all con una columna yyyymm adicional para la fecha del conjunto de datos. El esquema es idéntico al de las tablas sin procesar, con la adición de la fecha, lo que permite que se ejecuten consultas de comparación a lo largo del tiempo sin unir las tablas mensuales.