Metodologia raportu na temat użytkowania Chrome

W tej sekcji opisujemy, jak CrUX zbiera i porządkuje dane o wrażeniach użytkowników.

Dostępność

Podstawą zbioru danych CrUX są indywidualne wrażenia użytkowników, które są agregowane w rozkłady na poziomie strony i źródła. W tej sekcji opisujemy, kto może korzystać z danych, oraz wymagania dotyczące stron i źródeł, aby można je było uwzględnić w zbiorze danych. Aby wrażenia zostały uwzględnione w danych na poziomie strony dostępnych w PageSpeed Insights i interfejsie CrUX API, muszą być spełnione wszystkie kryteria kwalifikacji: użytkownik, źródło i strona. Wrażenia, które spełniają kryteria użytkownika i źródła, ale nie strony, nie są uwzględniane w danych na poziomie źródła dostępnych we wszystkich źródłach danych CrUX.

Strony i źródła są automatycznie dodawane do zbioru danych lub z niego usuwane, jeśli ich dostępność zmienia się z czasem. Obecnie nie można ręcznie przesyłać stron ani źródeł do uwzględnienia.

Widoczny dla wszystkich

Aby strona została uwzględniona w zbiorze danych CrUX, musi być widoczna dla wszystkich.

Strona jest uznawana za publicznie wykrywalną na podstawie tych samych kryteriów indeksowalności co w przypadku wyszukiwarek.

Strona nie może spełniać wymogu widoczności, jeśli spełniony jest którykolwiek z tych warunków, w tym strony główne w zbiorze danych źródła:

  • Strona jest wyświetlana z kodem stanu HTTP innym niż 200 (po przekierowaniach).
  • Strona jest wyświetlana z nagłówkiem HTTP X-Robots-Tag: noindex header lub jego odpowiednikiem.
  • Dokument zawiera <meta name="robots" content="noindex"> metatag lub jego odpowiednik.

Więcej informacji o stanie indeksowania witryny znajdziesz w Google Search Console.

Wystarczająco popularna

Strona jest uznawana za wystarczająco popularną, jeśli ma minimalną liczbę odwiedzających. Źródło jest uznawane za wystarczająco popularne, jeśli ma minimalną liczbę odwiedzających na wszystkich swoich stronach. Dokładna liczba nie jest ujawniana, ale została wybrana tak, abyśmy mieli wystarczającą liczbę próbek, aby mieć pewność co do rozkładów statystycznych uwzględnionych stron. Minimalna liczba jest taka sama w przypadku stron i źródeł.

Strony i źródła, które nie spełniają progu popularności, nie są uwzględniane w zbiorze danych CrUX.

Punkt początkowy

Źródło reprezentuje całą witrynę, do której można się odwołać za pomocą adresu URL, np. https://www.example.com. Aby źródło zostało uwzględnione w zbiorze danych CrUX, musi spełniać 2 wymagania:

  1. Widoczny dla wszystkich
  2. Wystarczająco popularna

Aby sprawdzić, czy Twoje źródło jest widoczne, przeprowadź a udyt Lighthouse i sprawdź wyniki w kategorii SEO. Twoja witryna nie jest widoczna, jeśli strona główna nie przejdzie audytów _Strona jest zablokowana przed indeksowaniem_ lub _Strona ma kod stanu HTTP oznaczający niepowodzenie_.

Jeśli źródło jest widoczne dla wszystkich, kwalifikujące się wrażenia użytkowników na wszystkich stronach tego źródła są agregowane na poziomie źródła, niezależnie od widoczności poszczególnych stron. Wszystkie te wrażenia są uwzględniane w wymaganiu dotyczącym popularności źródła.

Na potrzeby zapytań pamiętaj, że wszystkie źródła w zbiorze danych CrUX są zapisywane małymi literami.

Strona

Wymagania dotyczące strony uwzględnianej w zbiorze danych CrUX są takie same jak w przypadku źródeł:

  1. Widoczny dla wszystkich
  2. Wystarczająco popularna

Aby sprawdzić, czy strona jest widoczna, przeprowadź audyt Lighthouse i sprawdź wyniki w kategorii SEO. Twoja strona nie jest widoczna, jeśli nie przejdzie audytów _Strona jest zablokowana przed indeksowaniem_ lub _Strona ma kod stanu HTTP oznaczający niepowodzenie_.

Jeśli strona jest widoczna dla niektórych użytkowników, ale w pewnych okolicznościach zwraca kod stanu HTTP oznaczający niepowodzenie, te wrażenia nie będą uwzględniane w CrUX.

Strony często mają w adresie URL dodatkowe identyfikatory, w tym parametry ciągu zapytania, takie jak ?utm_medium=email, i fragmenty, takie jak #main. Te identyfikatory są usuwane z adresu URL w zbiorze danych CrUX, aby wszystkie wrażenia użytkowników na stronie były agregowane. Jest to przydatne w przypadku stron, które w przeciwnym razie nie spełniałyby progu popularności, gdyby istniało wiele rozłącznych wariantów adresu URL tej samej strony. Pamiętaj, że w rzadkich przypadkach może to spowodować nieoczekiwane grupowanie wrażeń na różnych stronach, np. jeśli parametry ?productID=101 i ?productID=102 reprezentują różne strony.

Strony w CrUX są mierzone na podstawie strony najwyższego poziomu. Strony uwzględnione jako elementy iframe nie są raportowane oddzielnie w CrUX, ale przyczyniają się do danych strony najwyższego poziomu. Jeśli na przykład strona https://www.example.com/page.html zawiera element iframe https://www.example.com/frame.html, to strona page.html będzie reprezentowana w CrUX (zgodnie z innymi kryteriami kwalifikacji), ale strona frame.html nie będzie. Jeśli strona frame.html ma słaby wskaźnik CLS, będzie on uwzględniany podczas pomiaru CLS dla strony page.html. CrUX to Raport na temat wrażeń użytkowników Chrome, a użytkownik może nawet nie wiedzieć, że jest to element iframe. Dlatego wrażenia są mierzone na stronie najwyższego poziomu – tak jak widzi to użytkownik.

Architektura witryny może utrudniać reprezentowanie jej danych w CrUX. Na przykład aplikacje jednostronicowe (SPA) mogą używać schematu przejścia między trasami opartego na JavaScript, aby przechodzić między stronami, w przeciwieństwie do konwencjonalnej nawigacji między stronami opartej na kotwicach. Te przejścia są dla użytkownika wyświetlane jako nowe odsłony, ale w przypadku Chrome i podstawowych interfejsów API platformy całe wrażenia są przypisywane do początkowej odsłony. Jest to ograniczenie interfejsów API platformy internetowej, na których opiera się CrUX. Więcej informacji znajdziesz w artykule Jak architektura SPA wpływa na Core Web Vitals w witrynie web.dev.

Użytkownik

Aby wrażenia użytkownika były agregowane w zbiorze danych CrUX, musi on spełniać te kryteria:

  1. Włącz raportowanie statystyk użytkowania.
  2. Synchronizuj historię przeglądania.
  3. Nie ustawiaj hasła synchronizacji.
  4. Korzystaj z obsługiwanej platformy.

Obecnie obsługiwane platformy to:

  • Wersje Chrome na komputery, w tym systemy operacyjne Windows, macOS, ChromeOS i Linux.
  • Wersje Chrome na Androida, w tym aplikacje mobilne korzystające z kart niestandardowych i WebAPKs.

Istnieje kilka ważnych wyjątków, które nie przekazują danych do zbioru danych CrUX:

  • Chrome na iOS.
  • Aplikacje na Androida korzystające z WebView.
  • Inne przeglądarki Chromium (np. Microsoft Edge).

Chrome nie publikuje danych o odsetku użytkowników, którzy spełniają te kryteria. Więcej informacji o zbieranych przez nas danych znajdziesz w artykule Chrome.

Przyspieszone strony mobilne (AMP)

Strony utworzone za pomocą AMP są uwzględniane w zbiorze danych CrUX tak jak każda inna strona internetowa. Od wersji CrUX z czerwca 2020 r. rejestrowane są też strony wyświetlane za pomocą AMP Cache lub renderowane w przeglądarce AMP, a ich adresy URL są przypisywane do adresu URL strony wydawcy.

Jakość danych

Dane w CrUX są poddawane niewielkiej ilości przetwarzania, aby zapewnić ich dokładność statystyczną, dobrą strukturę i łatwość wykonywania zapytań.

Filtrowanie

Zbiór danych CrUX jest filtrowany, aby zapewnić statystyczną ważność prezentowanych danych. Może to spowodować, że całe strony lub źródła nie będą się wyświetlać w zbiorze danych.

Oprócz kryteriów kwalifikacji stosowanych do źródeł i stron stosowane jest dalsze filtrowanie segmentów w danych:

Źródła lub strony, w przypadku których ponad 20% łącznego ruchu jest wykluczonych z powodu niekwalifikujących się kombinacji wymiarów, są całkowicie wykluczane ze zbioru danych.

Ponieważ zbiór danych na poziomie globalnym obejmuje wrażenia użytkowników ze wszystkich krajów, kombinacje wymiarów, które nie spełniają kryteriów popularności na poziomie kraju, mogą być nadal uwzględniane na poziomie globalnym, pod warunkiem że mają wystarczającą popularność.

Fuzzing

Do zbioru danych dodawana jest niewielka ilość losowości, aby uniemożliwić inżynierię wsteczną danych wrażliwych, takich jak łączna liczba odwiedzin. Nie ma to wpływu na dokładność statystyk zbiorczych.

Precyzja

Większość wartości danych w zbiorze danych CrUX jest reprezentowana jako histogramy wartości i rozmiarów przedziałów, gdzie wartość histogramu jest ułamkiem wszystkich uwzględnionych segmentów sumujących się do 1. Rozmiary przedziałów to liczby zmiennoprzecinkowe z zakresu od 1,0 do 0,0001.

Szerokości przedziałów histogramu są normalizowane, aby uprościć wykonywanie zapytań i wizualizację danych. Oznacza to, że większe przedziały mogą być dzielone na mniejsze, które w równym stopniu dzielą pierwotną gęstość, aby zachować spójne szerokości przedziałów.

Licencja

Zbiory danych CrUX udostępniane przez Google są objęte licencją Creative Commons Uznanie autorstwa 4.0 International.