Методология CruX

В этом разделе описывается, как CrUX собирает и систематизирует данные о пользовательском опыте.

Право на участие

В основе набора данных CrUX лежит индивидуальный пользовательский опыт, который агрегируется в распределения на уровне страницы и на уровне источника. В этом разделе документируются права пользователя и требования к страницам и источникам, которые должны быть включены в набор данных. Все критерии приемлемости должны быть удовлетворены, чтобы опыт был включен в данные на уровне страницы, доступные в PageSpeed ​​Insights и CrUX API: User , Origin и Page . Опыт, соответствующий критериям «Пользователь» и «Происхождение», но не «Страница», не включается в данные исходного уровня, доступные во всех источниках данных CrUX.

Страницы и источники автоматически включаются или удаляются из набора данных, если их соответствие требованиям со временем меняется. В настоящее время вы не можете вручную отправлять страницы или источники для включения.

Публично доступный

Страница должна быть общедоступной, чтобы ее можно было включить в набор данных CrUX.

Страница определяется как общедоступная с использованием тех же критериев индексируемости , что и поисковые системы.

Страница не может соответствовать требованию обнаружения, если выполняется любое из следующих условий, включая корневые страницы исходного набора данных:

  • Страница обслуживается с кодом состояния HTTP, отличным от 200 (после перенаправления).
  • Страница обслуживается с заголовком HTTP X-Robots-Tag: noindex или его эквивалентом.
  • Документ включает метатег <meta name="robots" content="noindex"> или его эквивалент .

Обратитесь к консоли поиска Google , чтобы получить обзор статуса индексирования вашего сайта.

Достаточно популярный

Страница считается достаточно популярной, если у нее минимальное количество посетителей. Источник считается достаточно популярным, если на всех его страницах присутствует минимальное количество посетителей. Точное число не разглашается, но оно было выбрано для того, чтобы у нас было достаточно выборок, чтобы быть уверенными в статистическом распределении включенных страниц. Минимальное количество одинаково для страниц и источников.

Страницы и источники, не соответствующие порогу популярности, не включаются в набор данных CrUX.

Источник

Источник представляет собой весь веб-сайт, доступный по URL-адресу, например https://www.example.com . Чтобы источник был включен в набор данных CrUX, он должен соответствовать двум требованиям:

  1. Публично доступный
  2. Достаточно популярный

Вы можете убедиться, что ваше происхождение можно обнаружить, проведя аудит Lighthouse и просмотрев результаты категории SEO. Ваш сайт невозможно обнаружить, если на вашей корневой странице произошел сбой , страница заблокирована от индексирования или страница имеет неудачные проверки кода состояния HTTP .

Если источник определен как общедоступный, соответствующие запросы пользователей на всех страницах этого источника агрегируются на уровне источника, независимо от доступности отдельной страницы для обнаружения. Весь этот опыт засчитывается в требование популярности источника.

Обратите внимание, что для целей запроса все источники в наборе данных CrUX указаны строчными буквами.

Страница

Требования к странице , которая должна быть включена в набор данных CrUX, такие же, как и к источникам:

  1. Публично доступный
  2. Достаточно популярный

Вы можете убедиться, что страница доступна для обнаружения, запустив аудит Lighthouse и просмотрев результаты категории SEO. Ваша страница не может быть обнаружена, если она не пройдена , Страница заблокирована от индексирования или Страница имеет неудачные проверки кода состояния HTTP .

Страницы обычно имеют дополнительные идентификаторы в своем URL-адресе, включая параметры строки запроса, такие как ?utm_medium=email , и фрагменты, такие как #main . Эти идентификаторы удаляются из URL-адреса в наборе данных CrUX, поэтому все действия пользователя на странице объединяются вместе. Это полезно для страниц, которые в противном случае не достигли бы порога популярности, если бы для одной и той же страницы было много несвязанных вариантов URL. Обратите внимание, что в редких случаях это может неожиданно сгруппировать впечатления для разных страниц вместе; например, если параметры ?productID=101 и ?productID=102 представляют разные страницы.

Страницы в CrUX измеряются на основе страницы верхнего уровня. Страницы, включенные в iframe, не учитываются отдельно в CrUX, но вносят вклад в показатели страницы верхнего уровня. Например, если https://www.example.com/page.html встраивает https://www.example.com/frame.html в iframe, то page.html будет представлен в CrUX (с учетом других требований критерии), frame.html не будет . А если frame.html плохой CLS , то CLS будет учитываться при измерении CLS для page.html . CrUX — это отчет об опыте пользователя Chrome, и пользователь может даже не знать, что это iframe. Таким образом, опыт измеряется на странице верхнего уровня — в зависимости от того, как ее видит пользователь.

Архитектура веб-сайта может усложнить представление его данных в CrUX. Например, одностраничные приложения (SPA) могут использовать схему перехода маршрутов на основе JavaScript для перемещения между страницами, в отличие от традиционной навигации по страницам на основе привязки. Эти переходы отображаются для пользователя как новые просмотры страниц, но для Chrome и API базовой платформы весь опыт приписывается начальному просмотру страницы. Это ограничение собственных API-интерфейсов веб-платформы, на которых построен CrUX. Дополнительные сведения см. в разделе «Как архитектуры SPA влияют на основные веб-показатели» на веб-сайте web.dev.

Пользователь

Чтобы пользователь мог объединить свой опыт в наборе данных CrUX, он должен соответствовать следующим критериям:

  1. Включите отчеты по статистике использования .
  2. Синхронизируйте историю браузера .
  3. Не установлен пароль синхронизации .
  4. Используйте поддерживаемую платформу.

Текущие поддерживаемые платформы:

  • Версии Chrome для настольных компьютеров, включая операционные системы Windows, MacOS, ChromeOS и Linux.
  • Версии Chrome для Android, включая собственные приложения с использованием пользовательских вкладок и WebAPK .

Есть несколько заметных исключений, которые не предоставляют данные в набор данных CrUX:

  • Хром на iOS.
  • Нативные приложения для Android, использующие WebView.
  • Другие браузеры Chromium (например , Microsoft Edge ).

Chrome не публикует данные о доле пользователей, соответствующих этим критериям. Подробнее о данных, которые мы собираем, можно узнать в Техническом документе по конфиденциальности Chrome .

Ускоренные мобильные страницы (AMP)

Страницы, созданные с помощью AMP, включаются в набор данных CrUX, как и любая другая веб-страница. Начиная с выпуска CrUX за июнь 2020 года , страницы, обслуживаемые через AMP Cache и/или отображаемые в AMP Viewer , также фиксируются и приписываются URL-адресу страницы издателя.

Качество данных

Данные в CrUX подвергаются небольшой обработке, чтобы гарантировать их статистическую точность, хорошую структурированность и простоту запроса.

Фильтрация

Набор данных CrUX фильтруется, чтобы гарантировать статистическую достоверность представленных данных. Это может исключить появление целых страниц или источников в наборе данных.

Помимо критериев приемлемости , применяемых к источникам и страницам, для сегментов данных применяется дополнительная фильтрация:

Источники или страницы, более 20 % общего трафика которых исключены из-за недопустимых комбинаций параметров, полностью исключаются из набора данных.

Поскольку набор данных глобального уровня охватывает опыт пользователей из всех стран, комбинации измерений, которые не соответствуют критериям популярности на уровне страны, все равно могут быть включены на глобальном уровне при условии, что существует достаточная популярность.

Фаззинг

К набору данных применяется небольшая доля случайности, чтобы предотвратить обратное проектирование конфиденциальных данных, таких как общие объемы трафика. Это не влияет на точность совокупной статистики.

Точность

Большинство значений метрик в наборе данных CrUX представлены в виде гистограмм значений и размеров интервалов, где значение гистограммы представляет собой долю всех включенных сегментов, сумма которых равна 1. Размеры интервалов представляют собой числа с плавающей запятой от 1,0 до 0,0001.

Ширина интервалов гистограммы нормализована для упрощения запроса и визуализации данных. Это означает, что более крупные ячейки могут быть разделены на более мелкие ячейки, которые в равной степени имеют исходную плотность, чтобы поддерживать постоянную ширину ячеек.

Лицензия

Наборы данных CrUX от Google лицензируются по международной лицензии Creative Commons Attribution 4.0 .