Metodología CrUX

En esta sección, se documenta cómo CrUX recopila y organiza los datos de la experiencia del usuario.

Elegibilidad

En el centro del conjunto de datos de CrUX, se encuentran las experiencias del usuario individuales, que se agregan en distribuciones a nivel de página y de origen. En esta sección, se documenta la elegibilidad de los usuarios y los requisitos para que las páginas y los orígenes se incluyan en el conjunto de datos. Se deben cumplir todos los criterios de elegibilidad para que se incluya una experiencia en los datos a nivel de la página disponibles en PageSpeed Insights y la API de CrUX: Usuario, Origen y Página. Las experiencias que cumplen con los criterios de Usuario y de Origen, pero no con la página, no se incluyen en los datos a nivel del origen disponibles en todas las fuentes de datos de CrUX.

Las páginas y los orígenes se incluyen automáticamente en el conjunto de datos o se quitan del conjunto de datos si su elegibilidad cambia con el tiempo. En este momento, no puedes enviar páginas ni orígenes de forma manual para su inclusión.

Visible públicamente

Para que se considere su inclusión en el conjunto de datos de CrUX, la página debe ser detectable de forma pública.

Se determina que una página es detectable públicamente usando los mismos criterios de indexabilidad que los motores de búsqueda.

Una página no puede cumplir con el requisito de visibilidad si se cumple cualquiera de las siguientes condiciones, incluidas las páginas raíz del conjunto de datos de origen:

  • La página se entrega con un código de estado HTTP distinto de 200 (después de los redireccionamientos).
  • La página se entrega con un encabezado HTTP X-Robots-Tag: noindex o equivalente.
  • El documento incluye una metaetiqueta <meta name="robots" content="noindex"> o su equivalente.

Consulta Google Search Console para obtener una descripción general del estado de indexación de tu sitio.

Bastante popular

Se determina que una página es lo suficientemente popular si tiene una cantidad mínima de visitantes. Se determina que un origen es lo suficientemente popular si tiene una cantidad mínima de visitantes en todas sus páginas. No se divulga un número exacto, pero se eligió para garantizar que tengamos suficientes muestras para confiar en las distribuciones estadísticas de las páginas incluidas. El número mínimo es el mismo para las páginas y los orígenes.

Las páginas y los orígenes que no cumplen con el umbral de popularidad no se incluyen en el conjunto de datos de CrUX.

Origen

Un origen representa un sitio web completo, al que se puede acceder mediante una URL como https://www.example.com. Para que un origen se incluya en el conjunto de datos de CrUX, debe cumplir dos requisitos:

  1. Visible públicamente
  2. Bastante popular

Para verificar que el origen sea detectable, ejecuta una auditoría de Lighthouse y observa los resultados de la categoría de SEO. Tu sitio no será detectable si la página raíz no pasa las auditorías de La página está bloqueada para la indexación o La página tiene errores de código de estado HTTP.

Si se determina que un origen es visible públicamente, las experiencias del usuario aptas en todas las páginas de ese origen se agregan a nivel del origen, independientemente de la visibilidad de la página individual. Todas estas experiencias se tienen en cuenta para el requisito de popularidad del origen.

Para fines de consulta, ten en cuenta que todos los orígenes del conjunto de datos de CrUX están en minúsculas.

Page

Los requisitos para que una página se incluya en el conjunto de datos de CrUX son los mismos que los orígenes:

  1. Visible públicamente
  2. Bastante popular

Para verificar que una página sea detectable, ejecuta una auditoría de Lighthouse y consulta los resultados de la categoría de SEO. Tu página no será detectable si falla las auditorías de La página está bloqueada para la indexación o La página tiene errores de código de estado HTTP.

Por lo general, las páginas tienen identificadores adicionales en su URL, incluidos parámetros de cadena de consulta como ?utm_medium=email y fragmentos como #main. Estos identificadores se quitan de la URL en el conjunto de datos de CrUX para que todas las experiencias del usuario en la página se agreguen juntas. Esto es útil para páginas que, de otro modo, no alcanzarían el umbral de popularidad si hubiera muchas variaciones inconexas de la URL en la misma página. Ten en cuenta que, en casos excepcionales, esto puede agrupar de forma inesperada las experiencias para páginas distintas; por ejemplo, si los parámetros ?productID=101 y ?productID=102 representan páginas diferentes.

Las páginas en CrUX se miden en función de la página de nivel superior. Las páginas incluidas como iframes no se informan por separado en CrUX, pero contribuyen a las métricas de la página de nivel superior. Por ejemplo, si https://www.example.com/page.html incorpora https://www.example.com/frame.html en un iframe, page.html se representará en CrUX (sujeto a otros criterios de elegibilidad), pero frame.html no lo hará. Y si frame.html tiene un CLS deficiente, el CLS se incluirá cuando se mida el CLS para page.html. CrUX es el Informe de experiencia del usuario de Chrome y es posible que el usuario ni siquiera sepa que se trata de un iframe. Por lo tanto, la experiencia se mide en la página de nivel superior, según la forma en que el usuario ve esto.

La arquitectura de un sitio web puede complicar la forma en que se representan sus datos en CrUX. Por ejemplo, las aplicaciones de una sola página (SPA) pueden usar un esquema de transición de ruta basado en JavaScript para moverse entre páginas, a diferencia de las navegaciones de páginas tradicionales basadas en anuncios fijos. Estas transiciones se muestran al usuario como nuevas páginas vistas, pero para Chrome y las APIs de la plataforma subyacente, toda la experiencia se atribuye a la vista de página inicial. Esta es una limitación de las APIs de las plataformas web nativas en las que se compila CrUX. Consulta Cómo las arquitecturas de SPA afectan las Métricas web esenciales en web.dev para obtener más información.

Usuario

Para que un usuario pueda agregar sus experiencias al conjunto de datos de CrUX, debe cumplir con los siguientes criterios:

  1. Habilita los informes estadísticos de uso.
  2. Sincronizar su historial de navegador.
  3. No tener una frase de contraseña de sincronización establecida.
  4. Usa una plataforma compatible.

Las plataformas compatibles actualmente son las siguientes:

  • Versiones de Chrome para computadoras de escritorio, incluidos los sistemas operativos Windows, macOS, ChromeOS y Linux
  • Versiones para Android de Chrome, incluidas las apps nativas que usan pestañas personalizadas y WebAPKs

Hay algunas excepciones notables que no proporcionan datos al conjunto de datos de CrUX:

  • Chrome en iOS
  • Aplicaciones nativas para Android que usan WebView
  • Otros navegadores Chromium (por ejemplo, Microsoft Edge)

Chrome no publica datos sobre las proporciones de usuarios que cumplen con estos criterios. Puedes obtener más información sobre los datos que recopilamos en el Informe de privacidad de Chrome.

Accelerated Mobile Pages (AMP)

Las páginas compiladas con AMP se incluyen en el conjunto de datos de CrUX como cualquier otra página web. A partir de la versión de CrUX de junio de 2020, las páginas publicadas a través de la Caché de AMP o renderizadas en el visor de AMP también se capturan y se atribuyen a la URL de la página del publicador.

Calidad de los datos

Los datos en CrUX se someten a una pequeña cantidad de procesamiento para garantizar que sean estadísticamente precisos, estén bien estructurados y sean fáciles de consultar.

Filtros

El conjunto de datos de CrUX se filtra para garantizar que los datos presentados sean estadísticamente válidos. Esto puede excluir páginas o orígenes enteros para que no aparezcan en el conjunto de datos.

Además de los criterios de elegibilidad que se aplican a los orígenes y a las páginas, se aplican filtros adicionales a los segmentos incluidos en los datos:

Los orígenes o páginas con más del 20% de su tráfico total excluido debido a combinaciones de dimensiones no aptas se excluyen por completo del conjunto de datos.

Debido a que el conjunto de datos a nivel global abarca experiencias del usuario de todos los países, las combinaciones de dimensiones que no cumplen con los criterios de popularidad a nivel del país pueden incluirse a nivel global de todos modos, siempre que la popularidad sea suficiente.

Fuzzing

Se aplica una pequeña aleatoriedad al conjunto de datos para evitar la ingeniería inversa de los datos sensibles, como los volúmenes totales de tráfico. Esto no afecta la precisión de las estadísticas agregadas.

Precisión

La mayoría de los valores de métricas dentro del conjunto de datos de CrUX se representan como histogramas de valores y tamaños de discretización, en los que el valor del histograma es una fracción de todos los segmentos incluidos que se suman a 1. Los tamaños de los depósitos son números de punto flotante entre 1.0 y 0.0001.

Los anchos de los contenedores del histograma se normalizan para simplificar las consultas y la visualización de los datos. Esto significa que los depósitos más grandes se pueden dividir en depósitos más pequeños, que comparten la densidad original de manera equitativa para mantener anchos coherentes.

Licencia

Los conjuntos de datos de CrUX de Google cuentan con la licencia internacional de Creative Commons Atribución 4.0