En esta sección, se explica cómo CrUX recopila y organiza los datos de la experiencia del usuario.
Requisitos
En el centro del conjunto de datos de CrUX, se encuentran las experiencias de los usuarios individuales, que se agregan en distribuciones a nivel de la página y del origen. En esta sección, se documenta la elegibilidad del usuario y los requisitos para que las páginas y los orígenes se incluyan en el conjunto de datos. Para que una experiencia se incluya en los datos a nivel de la página disponibles en PageSpeed Insights y la API de CrUX, se deben satisfacer todos los criterios de elegibilidad: Usuario, Origen y Página. Las experiencias que cumplen con los criterios de usuario y origen, pero no con los de página, no se incluyen en los datos a nivel del origen disponibles en todas las fuentes de datos de CrUX.
Las páginas y los orígenes se incluyen o quitan automáticamente del conjunto de datos si su elegibilidad cambia con el tiempo. Por el momento, no puedes enviar manualmente páginas ni orígenes para su inclusión.
Se puede encontrar públicamente
Para que una página se considere para su inclusión en el conjunto de datos de CrUX, debe ser detectable públicamente.
Se determina que una página es detectable públicamente con los mismos criterios de indexabilidad que los motores de búsqueda.
Una página no cumple con el requisito de detectabilidad si se cumple alguna de las siguientes condiciones, incluidas las páginas raíz del conjunto de datos de origen:
- La página se publica con un código de estado HTTP distinto de
200(después de los redireccionamientos). - La página se publica con un encabezado HTTP
X-Robots-Tag: noindexo su equivalente. - El documento incluye una
<meta name="robots" content="noindex">etiqueta meta o su equivalente.
Consulta Google Search Console para obtener un resumen del estado de indexación de tu sitio.
Suficientemente popular
Se determina que una página es lo suficientemente popular si tiene una cantidad mínima de visitantes. Se determina que un origen es lo suficientemente popular si tiene una cantidad mínima de visitantes en todas sus páginas. No se divulga un número exacto, pero se eligió para garantizar que tengamos suficientes muestras para confiar en las distribuciones estadísticas de las páginas incluidas. La cantidad mínima es la misma para las páginas y los orígenes.
Las páginas y los orígenes que no cumplen con el umbral de popularidad no se incluyen en el conjunto de datos de CrUX.
Origen
Un origen representa un sitio web completo, al que se puede acceder con una URL como https://www.example.com. Para que un origen se incluya en el conjunto de datos de CrUX, debe cumplir con dos requisitos:
Para verificar que tu origen sea detectable, ejecuta una auditoría de Lighthouse y consulta los resultados de la categoría SEO. No se puede descubrir tu sitio si la página principal no supera las auditorías de La página está bloqueada para la indexación o El código de estado HTTP de la página no es válido.
Si se determina que un origen es detectable públicamente, las experiencias del usuario que cumplen con los requisitos en todas las páginas de ese origen se agregan a nivel del origen, independientemente de la visibilidad de cada página. Todas estas experiencias se tienen en cuenta para el requisito de popularidad del origen.
Para realizar consultas, ten en cuenta que todos los orígenes del conjunto de datos de CrUX están en minúsculas.
Página
Los requisitos para que una página se incluya en el conjunto de datos de CrUX son los mismos que para los orígenes:
Para verificar si se puede descubrir una página, ejecuta una auditoría de Lighthouse y consulta los resultados de la categoría de SEO. Tu página no se puede descubrir si no supera las auditorías de La página está bloqueada para la indexación o El código de estado HTTP de la página no es válido.
Si la página se puede descubrir públicamente para algunos usuarios, pero devuelve un estado HTTP no exitoso en algunas circunstancias, esas experiencias no se incluirán en CrUX.
Las páginas suelen tener identificadores adicionales en su URL, incluidos parámetros de cadena de consulta como ?utm_medium=email y fragmentos como #main. Estos identificadores se quitan de la URL en el conjunto de datos de CrUX para que todas las experiencias del usuario en la página se agreguen juntas. Esto es útil para las páginas que, de lo contrario, no cumplirían con el umbral de popularidad si hubiera muchas variaciones de URL no relacionadas para la misma página. Ten en cuenta que, en casos excepcionales, esto puede agrupar de forma inesperada las experiencias de páginas distintas; por ejemplo, si los parámetros ?productID=101 y ?productID=102 representan páginas diferentes.
Las páginas de CrUX se miden en función de la página de nivel superior. Las páginas incluidas como iframes no se registran por separado en CrUX, pero contribuyen a las métricas de la página de nivel superior. Por ejemplo, si https://www.example.com/page.html incorpora https://www.example.com/frame.html en un iframe, page.html se representará en CrUX (sujeto a los demás criterios de elegibilidad), pero frame.html no se representará. Además, si frame.html tiene un CLS deficiente, se incluirá el CLS cuando se mida el CLS para page.html. CrUX es el Informe sobre la experiencia del usuario de Chrome, y es posible que el usuario ni siquiera se dé cuenta de que se trata de un iframe. Por lo tanto, la experiencia se mide en la página de nivel superior, tal como la ve el usuario.
La arquitectura de un sitio web puede complicar la forma en que se representan sus datos en CrUX. Por ejemplo, las apps de una sola página (SPA) pueden usar un esquema de transición de ruta basado en JavaScript para moverse entre páginas, a diferencia de las navegaciones de página convencionales basadas en anclajes. Estas transiciones aparecen como vistas de página nuevas para el usuario, pero para Chrome y las APIs de la plataforma subyacente, toda la experiencia se atribuye a la vista de página inicial. Esta es una limitación de las APIs de la plataforma web en las que se basa CrUX. Consulta Cómo afectan las arquitecturas de SPA a las Métricas web esenciales en web.dev para obtener más información.
Usuario
Para que las experiencias de un usuario se agreguen en el conjunto de datos de CrUX, este debe cumplir con los siguientes criterios:
- Habilita los informes de estadísticas de uso.
- Sincronizar su historial del navegador
- No tener establecida una frase de contraseña de sincronización
- Usar una plataforma compatible
Las plataformas compatibles actualmente son las siguientes:
- Versiones de Chrome para computadoras, incluidos los sistemas operativos Windows, macOS, ChromeOS y Linux
- Versiones de Chrome para Android, incluidas las apps para dispositivos móviles que usan pestañas personalizadas y WebAPKs
Hay algunas excepciones notables que no proporcionan datos al conjunto de datos de CrUX:
- Chrome en iOS
- Apps para Android que usan WebView
- Otros navegadores basados en Chromium (por ejemplo, Microsoft Edge)
Chrome no publica datos sobre las proporciones de usuarios que cumplen con estos criterios. Puedes obtener más información sobre los datos que recopilamos en Chrome.
Accelerated Mobile Pages (AMP)
Las páginas creadas con AMP se incluyen en el conjunto de datos de CrUX como cualquier otra página web. Desde la versión de CrUX de junio de 2020, también se capturan las páginas publicadas con la Caché de AMP o renderizadas en el Visor de AMP, y se atribuyen a la URL de la página del publicador.
Calidad de los datos
Los datos de CrUX se someten a un pequeño procesamiento para garantizar que sean estadísticamente precisos, estén bien estructurados y sean más fáciles de consultar.
Filtros
El conjunto de datos de CrUX se filtra para garantizar que los datos presentados sean estadísticamente válidos. Esto puede excluir páginas o orígenes completos del conjunto de datos.
Además de los criterios de elegibilidad que se aplican a los orígenes y las páginas, se aplica un filtrado adicional a los segmentos dentro de los datos:
Las páginas o las fuentes que tienen más del 20% de su tráfico total excluido debido a combinaciones de dimensiones no aptas se excluyen por completo del conjunto de datos.
Dado que el conjunto de datos a nivel global abarca las experiencias de los usuarios de todos los países, es posible que las combinaciones de dimensiones que no cumplen con los criterios de popularidad a nivel del país se incluyan a nivel global, siempre que haya suficiente popularidad.
Fuzzing
Se aplica una pequeña cantidad de aleatoriedad al conjunto de datos para evitar la ingeniería inversa de datos sensibles, como los volúmenes totales de tráfico. Esto no afecta la precisión de las estadísticas agregadas.
Precisión
La mayoría de los valores de las métricas dentro del conjunto de datos de CrUX se representan como histogramas de valores y tamaños de discretización, en los que el valor del histograma es una fracción de todos los segmentos incluidos que suman 1. Los tamaños de discretización son números de punto flotante entre 1.0 y 0.0001.
Los ancho de las discretizaciones del histograma se normalizan para simplificar las consultas y la visualización de los datos. Esto significa que las discretizaciones más grandes se pueden dividir en discretizaciones más pequeñas, que comparten por igual la densidad original para mantener anchos de discretización coherentes.
Licencia
Los conjuntos de datos de CrUX de Google se ofrecen bajo una licencia internacional de Creative Commons Attribution 4.0.