Metodologia CrUX

Questa sezione documenta in che modo CrUX raccoglie e organizza i dati relativi all'esperienza utente.

Idoneità

Alla base del set di dati CrUX ci sono le singole esperienze utente, che vengono aggregate in distribuzioni a livello di pagina e di origine. Questa sezione documenta l'idoneità degli utenti e i requisiti per includere pagine e origini nel set di dati. Tutti i criteri di idoneità devono essere soddisfatti affinché un'esperienza venga inclusa nei dati a livello di pagina disponibili in PageSpeed Insights e nell'API CrUX: Utente, Origine e Pagina. Le esperienze che soddisfano i criteri relativi all'utente e all'origine, ma non a quella pagina, non sono incluse nei dati a livello di origine disponibili in tutte le origini dati di CrUX.

Pagine e origini vengono incluse o rimosse automaticamente dal set di dati se la loro idoneità cambia nel tempo. Al momento non puoi inviare manualmente pagine o origini da includere.

Rilevabili pubblicamente

Per essere presa in considerazione per l'inclusione nel set di dati CrUX, una pagina deve essere individuabile pubblicamente.

Una pagina viene determinata come rilevabile pubblicamente utilizzando gli stessi criteri di indicizzazione dei motori di ricerca.

Una pagina non può soddisfare il requisito di rilevabilità se viene soddisfatta una delle seguenti condizioni, incluse le pagine principali per il set di dati di origine:

  • La pagina viene pubblicata con un codice di stato HTTP diverso da 200 (dopo i reindirizzamenti).
  • La pagina viene pubblicata con un'intestazione HTTP X-Robots-Tag: noindex o equivalente.
  • Il documento include un meta tag <meta name="robots" content="noindex"> o un elemento equivalente.

Consulta Google Search Console per una panoramica dello stato di indicizzazione del tuo sito.

Abbastanza popolare

Una pagina viene considerata sufficientemente popolare se ha un numero minimo di visitatori. Un'origine viene considerata sufficientemente popolare se ha un numero minimo di visitatori in tutte le sue pagine. Non viene divulgato un numero esatto, ma è stato scelto per garantire un numero sufficiente di campioni per poter stabilire con esattezza le distribuzioni statistiche delle pagine incluse. Il numero minimo è lo stesso per le pagine e le origini.

Le pagine e le origini che non soddisfano la soglia di popolarità non sono incluse nel set di dati CrUX.

Origine

Un'origine rappresenta un intero sito web, raggiungibile da un URL come https://www.example.com. Affinché un'origine venga inclusa nel set di dati CrUX, deve soddisfare due requisiti:

  1. Rilevabile pubblicamente
  2. Abbastanza popolare

Puoi verificare che la tua origine sia rilevabile eseguendo un controllo Lighthouse e esaminando i risultati delle categorie SEO. Il tuo sito non è rilevabile se la pagina principale non supera i controlli La pagina è bloccata per l'indicizzazione o se La pagina non ha un codice di stato HTTP non riuscito.

Se viene stabilito che un'origine è rilevabile pubblicamente, le esperienze utente idonee su tutte le pagine dell'origine vengono aggregate a livello di origine, indipendentemente dalla rilevabilità delle singole pagine. Tutte queste esperienze contano ai fini del requisito di popolarità dell'origine.

Ai fini di query, tieni presente che tutte le origini nel set di dati CrUX sono in minuscolo.

Pagina

I requisiti per includere una pagina nel set di dati CrUX corrispondono a quelli delle origini:

  1. Rilevabile pubblicamente
  2. Abbastanza popolare

Puoi verificare che una pagina sia rilevabile eseguendo un controllo Lighthouse e esaminando i risultati delle categorie SEO. La tua pagina non è rilevabile se non supera i controlli L'indicizzazione della pagina è bloccata o La pagina ha un codice di stato HTTP non riuscito.

Se la pagina è rilevabile pubblicamente per alcuni utenti, ma in alcuni casi restituisce uno stato HTTP che non va a buon fine, queste esperienze non verranno incluse in CrUX.

In genere, gli URL delle pagine includono identificatori aggiuntivi, inclusi parametri della stringa di query come ?utm_medium=email e frammenti come #main. Questi identificatori vengono eliminati dall'URL nel set di dati CrUX in modo che tutte le esperienze utente sulla pagina vengano aggregate. Questo è utile per le pagine che altrimenti non raggiungerebbero la soglia di popolarità nel caso in cui ci fossero molte varianti di URL separate per la stessa pagina. Tieni presente che, in rari casi, questo potrebbe inaspettatamente raggruppare le esperienze per pagine distinte, ad esempio se i parametri ?productID=101 e ?productID=102 rappresentano pagine diverse.

Le pagine in CrUX vengono misurate in base alla pagina di primo livello. Le pagine incluse come iframe non vengono registrate separatamente in CrUX, ma contribuiscono alle metriche della pagina di primo livello. Ad esempio, se https://www.example.com/page.html incorpora https://www.example.com/frame.html in un iframe, page.html verrà rappresentato in CrUX (soggetto agli altri criteri di idoneità), ma frame.html non. E se frame.html ha una CLS bassa, la CLS verrà inclusa nella misurazione della CLS per page.html. CrUX è il report Esperienza utente di Chrome e un utente potrebbe persino non sapere che si tratta di un iframe. Di conseguenza, l'esperienza viene misurata nella pagina di primo livello, in base a come la vede l'utente.

L'architettura di un sito web può complicare il modo in cui i dati sono rappresentati in CrUX. Ad esempio, le app a pagina singola (APS) possono utilizzare uno schema di transizione del percorso basato su JavaScript per spostarsi da una pagina all'altra, rispetto alle tradizionali navigazioni nelle pagine basate sugli ancoraggi. Queste transizioni vengono mostrate all'utente come nuove visualizzazioni di pagina, ma per Chrome e le API della piattaforma sottostanti l'intera esperienza viene attribuita alla visualizzazione di pagina iniziale. Si tratta di un limite delle API delle piattaforme web su cui è realizzato CrUX. Per saperne di più, consulta In che modo le architetture SPA influiscono sui Core Web Vitals su web.dev.

Utente

Affinché un utente possa aggregare le proprie esperienze nel set di dati CrUX, deve soddisfare i seguenti criteri:

  1. Attiva i report sulle statistiche di utilizzo.
  2. Sincronizzare la cronologia del browser.
  3. Non avere impostato una passphrase di sincronizzazione.
  4. Utilizza una piattaforma supportata.

Le piattaforme attualmente supportate sono:

  • Versioni desktop di Chrome, inclusi i sistemi operativi Windows, macOS, ChromeOS e Linux.
  • Versioni Android di Chrome, incluse le app mobile che utilizzano schede personalizzate e WebAPKs.

Esistono alcune eccezioni degne di nota che non forniscono dati al set di dati CrUX:

  • Chrome su iOS.
  • App per Android che utilizzano WebView.
  • Altri browser Chromium (ad esempio Microsoft Edge).

Chrome non pubblica dati sulle proporzioni di utenti che soddisfano questi criteri. Scopri di più sui dati che raccogliamo nel white paper sulla privacy di Chrome.

Pagine AMP (Accelerated Mobile Pages)

Le pagine create con AMP sono incluse nel set di dati CrUX come qualsiasi altra pagina web. A partire dalla release di CrUX di giugno 2020, anche le pagine pubblicate utilizzando la cache AMP e / o il rendering nel visualizzatore AMP vengono acquisite e attribuite all'URL della pagina del publisher.

Qualità dei dati

I dati in CrUX vengono sottoposti a una piccola quantità di elaborazione per garantire che siano statisticamente accurati, ben strutturati e più facili da interrogare.

Applicazione dei filtri

Il set di dati CrUX viene filtrato per garantire che i dati presentati siano statisticamente validi. Ciò potrebbe escludere intere pagine o origini dalla visualizzazione nel set di dati.

Oltre ai criteri di idoneità applicati a origini e pagine, vengono applicati ulteriori filtri ai segmenti all'interno dei dati:

Le origini o le pagine con più del 20% del traffico totale escluse a causa di combinazioni di dimensioni non idonee vengono escluse completamente dal set di dati.

Poiché il set di dati a livello globale include le esperienze utente di tutti i paesi, le combinazioni di dimensioni che non soddisfano i criteri di popolarità a livello di paese possono comunque essere incluse a livello globale, a condizione che la popolarità sia sufficiente.

Fuzzing

Una piccola quantità di casualità viene applicata al set di dati per impedire il reverse engineering dei dati sensibili, come i volumi di traffico totali. Ciò non influisce sull'accuratezza delle statistiche aggregate.

Precisione

La maggior parte dei valori delle metriche all'interno del set di dati CrUX sono rappresentati come istogrammi di valori e dimensioni bin, dove il valore dell'istogramma è una frazione di tutti i segmenti inclusi sommati a 1. Le dimensioni bin sono numeri in virgola mobile compresi tra 1,0 e 0,0001.

Le larghezze dei bin a istogrammi sono normalizzate per semplificare l'esecuzione di query e la visualizzazione dei dati. Ciò significa che i bin più grandi possono essere suddivisi in bin più piccoli, che condividono equamente la densità originale per mantenere larghezze dei bin più coerenti.

Licenza

I set di dati CrUX di Google sono concessi ai sensi di una licenza internazionale Creative Commons Attribution 4.0.