Cómo agregar la magnitud de la clasificación al informe CrUX en BigQuery

A partir del conjunto de datos de febrero de 2021, agregaremos una métrica experimental al informe CrUX de BigQuery que distingue la popularidad de los orígenes por orden de magnitud: los 1,000 orígenes principales, los 10,000, los 100,000, los 1 millón más populares, ...

Veamos cómo se ve esto en la práctica:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Fila rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 100,000 90,000
4 1,000,000 900,000
15 10,000,000 7.264.371

Para el conjunto de datos globales de febrero de 2021, obtenemos 5 buckets. Como era de esperar, en la fila 1, Vemos que hay 1,000 orígenes con una magnitud de clasificación 1,000, el 1,000 más orígenes populares según nuestra métrica. La fila 2 puede parecer sorprendente, lo que indica que hay son solo 9,000 orígenes que están en el conjunto de los 10,000 principales; esto se debe a que los orígenes en la fila 1 son forma parte del conjunto de los 10,000 perfiles principales. Para seleccionar los 10,000 orígenes principales, debes especifica experimental.popularity.rank <= 10,000 cuando realices consultas.

El conjunto de datos también contiene la magnitud del rango específico del país. Por ejemplo, esta una lista de los 10,000 orígenes más populares en Alemania.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Para abordar el potencial de nuestra nueva métrica de popularidad, veamos de la Web difieren con respecto a la métrica de primer procesamiento de imagen con contenido (FCP). A los efectos de esta consulta, consideramos que 1 segundo es una experiencia rápida del usuario.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

Para los orígenes con experimental.popularity.rank <= 1,000, la consulta suma todo Densidades de buckets de histogramas para valores de métricas FCP inferiores a 1000 ms y divide por el número de orígenes, es decir, calcula el porcentaje promedio de cargas rápidas de FCP para los 1,000 orígenes más populares. En esta consulta, todos los orígenes tienen el mismo peso, por lo que podría decirse que no es perfecto. Pero veamos si el resultado es sensible a la magnitud del rango, ya que altera la cláusula WHERE especifica experimental.popularity.rank <= 10,000. Lo hacemos para 10,000, 100,000, y el:

Magnitud de clasificación de los orígenes Porcentaje de FCP < 1, promediado sobre los orígenes
1,000 53,6%
10,000 49,6%
100,000 45,9%
1,000,000 43,2%
10,000,000 39,9%

Esto indica que una experiencia del usuario más rápida en la Web se correlaciona con ser más popular.

En el conjunto de datos de octubre de 2022, esto se dividió aún más en pasos de medio rango. Volver a ejecutar la primera consulta para este conjunto de datos muestra los medios pasos y la cantidad de orígenes en cada magnitud de clasificación:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Fila rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 100,000 50,000
6 500,000 400,000
7 1,000,000 500,000
8 5,000,000 4,000,000
9 10,000,000 5,000,000
10 50,000,000 7.637.195

Obtén más información para usar CrUX en BigQuery y explora la Guía de soluciones de CrUX para ver más ejemplos de consultas. Si lo deseas, comparte tus consultas y cuéntanos qué encuentras.