Méthodologie CrUX

Cette section explique comment CrUX collecte et organise les données sur l'expérience utilisateur.

Éligibilité

Les expériences utilisateur individuelles sont au cœur de l'ensemble de données CrUX, regroupées sous forme de répartitions au niveau de la page et au niveau de l'origine. Cette section documente l'éligibilité des utilisateurs et les exigences concernant les pages et les origines à inclure dans l'ensemble de données. Tous les critères d'éligibilité doivent être remplis pour qu'une expérience soit incluse dans les données au niveau de la page disponibles dans PageSpeed Insights et l'API CrUX: User (Utilisateur), Origin (Origine) et Page (Page). Les expériences qui répondent aux critères "Utilisateur" et "Origine", mais pas à la page "Page", ne sont pas incluses dans les données au niveau de l'origine disponibles dans toutes les sources de données CrUX.

Les pages et les origines sont automatiquement incluses ou supprimées de l'ensemble de données si leur éligibilité change au fil du temps. Pour le moment, vous ne pouvez pas envoyer manuellement des pages ou des origines.

Visibilité publique

Pour qu'une page puisse être incluse dans l'ensemble de données CrUX, elle doit être accessible au public.

Une page est considérée comme visible publiquement selon les mêmes critères d'indexabilité que les moteurs de recherche.

Une page ne peut pas répondre aux exigences de visibilité si l'une des conditions suivantes est remplie, y compris les pages racines de l'ensemble de données d'origine:

  • La page est diffusée avec un code d'état HTTP autre que 200 (après les redirections).
  • La page est diffusée avec un en-tête HTTP X-Robots-Tag: noindex ou un équivalent.
  • Le document inclut une balise Meta <meta name="robots" content="noindex"> ou un équivalent.

Pour connaître l'état d'indexation de votre site, consultez la Google Search Console.

Assez populaire

Une page est considérée comme suffisamment populaire si elle enregistre un nombre minimal de visiteurs. Une origine est considérée comme suffisamment populaire si elle enregistre un nombre minimal de visiteurs sur l'ensemble de ses pages. Le nombre exact n'est pas divulgué, mais il a été choisi pour garantir que nous disposons d'échantillons suffisants pour pouvoir se fier aux distributions statistiques des pages incluses. Le nombre minimal est le même pour les pages et les origines.

Les pages et les origines qui n'atteignent pas le seuil de popularité ne sont pas incluses dans l'ensemble de données CrUX.

Origine

Une origine représente un site Web entier, adressable par une URL telle que https://www.example.com. Pour qu'une origine soit incluse dans l'ensemble de données CrUX, elle doit répondre à deux exigences:

  1. Accessible à tous
  2. Suffisamment populaire

Pour vérifier que votre origine est visible, exécutez un audit Lighthouse et examinez les résultats des catégories SEO. Votre site n'est pas visible si votre page racine échoue aux audits L'indexation de la page est bloquée ou La page présente un code d'état HTTP d'échec.

Si une origine est déterminée comme étant visible publiquement, les expériences utilisateur éligibles sur toutes les pages de cette origine sont agrégées au niveau de l'origine, quelle que soit la visibilité de chaque page. Toutes ces expériences sont prises en compte dans le critère de popularité de l'origine.

À des fins d'interrogation, notez que toutes les origines de l'ensemble de données CrUX sont en minuscules.

Page

Les exigences pour qu'une page soit incluse dans l'ensemble de données CrUX sont les mêmes que pour les origines:

  1. Accessible à tous
  2. Suffisamment populaire

Pour vérifier qu'une page est visible, exécutez un audit Lighthouse et examinez les résultats des catégories SEO. Votre page n'est pas visible si les audits L'indexation de la page est bloquée ou Code d'état HTTP d'échec de la page échoue.

Les pages ont généralement des identifiants supplémentaires dans leur URL, y compris des paramètres de chaîne de requête tels que ?utm_medium=email et des fragments comme #main. Ces identifiants sont supprimés de l'URL dans l'ensemble de données CrUX afin que toutes les expériences utilisateur sur la page soient regroupées. Cette option est utile pour les pages qui, autrement, n'atteindraient pas le seuil de popularité s'il existait de nombreuses variantes d'URL incohérentes pour la même page. Notez que, dans de rares cas, cela peut regrouper de manière inattendue des expériences pour des pages distinctes (par exemple, si les paramètres ?productID=101 et ?productID=102 représentent des pages différentes).

Les pages dans CrUX sont mesurées en fonction de la page de premier niveau. Les pages incluses en tant qu'iFrames ne sont pas comptabilisées séparément dans CrUX, mais elles contribuent aux métriques de la page de premier niveau. Par exemple, si https://www.example.com/page.html intègre https://www.example.com/frame.html dans un iFrame, page.html sera représenté dans CrUX (sous réserve des autres critères d'éligibilité), mais frame.html ne le sera pas. Si frame.html présente un CLS faible, le CLS sera inclus lors de la mesure du CLS pour page.html. L'expérience utilisateur CrUX correspond au rapport Expérience utilisateur de Chrome. Un utilisateur peut même ne pas être au courant qu'il s'agit d'un iFrame. Par conséquent, l'expérience est mesurée au niveau de la page de premier niveau, en fonction de la façon dont l'utilisateur voit cela.

L'architecture d'un site Web peut compliquer la représentation de ses données dans CrUX. Par exemple, les applications monopages (SPA) peuvent utiliser un schéma de transition de route basé sur JavaScript pour se déplacer entre les pages, contrairement aux navigations de pages traditionnelles basées sur l'ancrage. Ces transitions apparaissent comme de nouvelles pages vues pour l'utilisateur, mais dans Chrome et les API de la plate-forme sous-jacentes, l'expérience globale est attribuée à la page vue initiale. Il s'agit d'une limite des API de plates-formes Web natives sur lesquelles l'expérience utilisateur CrUX est basée. Pour en savoir plus, consultez la section Comment les architectures SPA affectent les Signaux Web essentiels sur web.dev.

Utilisateur

Pour que les expériences d'un utilisateur soient agrégées dans l'ensemble de données CrUX, il doit répondre aux critères suivants:

  1. Activez la création de rapports sur les statistiques d'utilisation.
  2. synchroniser l'historique de leur navigateur ;
  3. vous n'avez pas défini de phrase secrète de synchronisation.
  4. utiliser une plate-forme compatible ;

Les plates-formes actuellement compatibles sont les suivantes:

  • Versions de bureau de Chrome, y compris les systèmes d'exploitation Windows, macOS, ChromeOS et Linux
  • Versions Android de Chrome, y compris les applications natives utilisant des onglets personnalisés et des WebAPKs.

Il existe quelques exceptions notables qui ne fournissent pas de données à l'ensemble de données CrUX:

  • Chrome sur iOS.
  • Applications Android natives utilisant WebView
  • d'autres navigateurs Chromium (par exemple, Microsoft Edge) ;

Chrome ne publie aucune donnée sur les proportions d'utilisateurs qui répondent à ces critères. Pour en savoir plus sur les données que nous collectons, consultez le livre blanc sur la confidentialité dans Chrome.

Accelerated Mobile Pages (AMP)

Les pages créées avec AMP sont incluses dans l'ensemble de données CrUX, comme n'importe quelle autre page Web. Depuis la version CrUX de juin 2020, les pages diffusées via AMP Cache et / ou affichées dans le lecteur AMP sont également capturées et attribuées à l'URL de la page de l'éditeur.

Qualité des données

Les données dans CrUX subissent un petit traitement pour garantir leur exactitude statistique, leur structure bien structurée et leur facilité d'interrogation.

Filtrage

L'ensemble de données CrUX est filtré pour garantir la validité statistique des données présentées. Cela peut exclure des pages ou des origines entières de l'ensemble de données.

En plus des critères d'éligibilité appliqués aux origines et aux pages, un filtrage supplémentaire est appliqué aux segments de données:

Les origines ou les pages dont plus de 20% du trafic total sont exclus en raison de combinaisons de dimensions non éligibles sont complètement exclues de l'ensemble de données.

Étant donné que l'ensemble de données au niveau mondial englobe les expériences utilisateur de tous les pays, les combinaisons de dimensions qui ne répondent pas aux critères de popularité au niveau du pays peuvent tout de même être incluses au niveau mondial, à condition que leur popularité soit suffisante.

Fuzzing

Un faible degré de hasard est appliqué à l'ensemble de données pour empêcher la rétro-ingénierie des données sensibles, comme les volumes de trafic totaux. Cela n'affecte pas l'exactitude des statistiques globales.

Précision

La plupart des valeurs de métriques de l'ensemble de données CrUX sont représentées par des histogrammes de valeurs et de tailles de bins, où la valeur de l'histogramme est une fraction de tous les segments inclus additionnés à 1. Les tailles de bins sont des nombres à virgule flottante compris entre 1 et 0,0001.

Les largeurs de bins de l'histogramme sont normalisées pour simplifier l'interrogation et la visualisation des données. Cela signifie que des classes plus importantes peuvent être divisées en classes plus petites, qui partagent de manière égale la densité d'origine afin de maintenir des largeurs de bins cohérentes.

Licence

Les ensembles de données CrUX de Google sont concédés sous licence Creative Commons Attribution 4.0 International.