Cómo agregar la magnitud de la clasificación al informe CrUX en BigQuery

A partir del conjunto de datos de febrero de 2021, agregaremos una métrica experimental al informe CrUX en BigQuery que distingue la popularidad de los orígenes por órdenes de magnitud: los 1,000 orígenes principales, los 10,000 principales, los 100,000 principales, los 1,000,000 principales, etcétera.

Veamos cómo se ve esto en la práctica:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Fila rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 100,000 90,000
4 1,000,000 900,000
15 10,000,000 7,264,371

Para el conjunto de datos globales de febrero de 2021, obtenemos 5 buckets. Como se esperaba, en la fila 1, vemos que hay 1,000 orígenes con magnitud de clasificación 1,000, los 1,000 orígenes más populares según nuestra métrica. La fila 2 puede parecer sorprendente, ya que indica que solo hay 9,000 orígenes en el conjunto de los 10,000 principales. Esto se debe a que los orígenes de la fila 1 también forman parte del conjunto de los 10,000 principales. Para seleccionar los 10,000 orígenes principales, se debe especificar experimental.popularity.rank <= 10000 cuando se realiza una consulta.

El conjunto de datos también contiene la magnitud de la clasificación específica de cada país. Por ejemplo, esta consulta muestra los 10,000 orígenes más populares en Alemania.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Para conocer el potencial de nuestra nueva métrica de popularidad, veamos cómo difieren los segmentos de popularidad de la Web con respecto a la métrica de primer procesamiento de imagen con contenido (FCP). A los efectos de esta consulta, consideraremos que 1 segundo es una experiencia del usuario rápida.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

Para los orígenes con experimental.popularity.rank <= 1,000, la consulta suma todas las densidades de bucket del histograma para los valores de la métrica FCP menores que 1,000 ms y las divide por la cantidad de orígenes; es decir, calcula el porcentaje promedio de cargas de FCP rápidas para los 1,000 orígenes más populares. En esta consulta, todos los orígenes tienen el mismo peso, por lo que se podría decir que no es perfecta. Sin embargo, veamos si el resultado es sensible al cambio de la magnitud de la clasificación. Para ello, modifica la cláusula where para especificar experimental.popularity.rank <= 10000. Lo hacemos para 10,000, 100,000, etc.:

Magnitud de clasificación de los orígenes Porcentaje de FCP < 1 s, promediado sobre los orígenes
1,000  53.6%
10,000 49.6%
100,000 45,9%
1,000,000 43.2%
10,000,000 39.9%

Esto indica que una experiencia del usuario más rápida en la Web está correlacionada con ser más popular.

En el conjunto de datos de octubre de 2022, esto se dividió aún más en pasos de medio rango. Si vuelves a ejecutar la primera consulta para este conjunto de datos, se mostrarán los semitonos y la cantidad de orígenes en cada magnitud de clasificación:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Fila rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 100,000 50,000
6 500,000 400,000
7 1,000,000 500,000
8 5,000,000 4,000,000
9 10,000,000 5,000,000
10 50,000,000 7,637,195

Obtén más información para usar CrUX en BigQuery y explora la Guía de soluciones de CrUX para ver más ejemplos de consultas. Si lo deseas, comparte tus consultas y cuéntanos qué encuentras.