В этом разделе описывается, как CrUX собирает и организует данные об опыте пользователей.
Критерии отбора
В основе набора данных CrUX лежат индивидуальные пользовательские истории, которые агрегируются в распределения на уровне страниц и на уровне источников. В этом разделе описаны критерии отбора пользователей и требования к страницам и источникам для включения в набор данных. Для включения истории в данные на уровне страниц, доступные в PageSpeed Insights и CrUX API, должны быть соблюдены все критерии отбора: Пользователь , Источник и Страница . Истории, которые соответствуют критериям Пользователь и Источник, но не Страница, не включаются в данные на уровне источников, доступные во всех источниках данных CrUX.
Страницы и источники автоматически включаются или удаляются из набора данных, если их соответствие критериям со временем меняется. В настоящее время вы не можете вручную отправлять страницы или источники для включения.
Доступно для публичного просмотра
Для включения в набор данных CrUX страница должна быть общедоступной.
Доступность страницы для публичного просмотра определяется с помощью тех же критериев индексируемости , что и у поисковых систем.
Страница не может соответствовать требованиям доступности, если выполняется хотя бы одно из следующих условий, включая корневые страницы исходного набора данных:
- Страница отображается с HTTP- статусом, отличным от
200(после перенаправлений). - Страница отображается с HTTP- заголовком
X-Robots-Tag: noindexили аналогичным. - В документе присутствует метатег
<meta name="robots" content="noindex">или его аналог.
Для получения обзора статуса индексации вашего сайта обратитесь к Google Search Console .
Достаточно популярный
Страница считается достаточно популярной, если она имеет минимальное количество посетителей. Источник считается достаточно популярным, если он имеет минимальное количество посетителей на всех своих страницах. Точное число не разглашается, но оно было выбрано для того, чтобы обеспечить достаточное количество выборок для уверенности в статистическом распределении включенных страниц. Минимальное число одинаково для страниц и источников.
Страницы и источники, не соответствующие порогу популярности, не включены в набор данных CrUX.
Источник
Источник представляет собой целый веб-сайт, доступный по URL-адресу, например, https://www.example.com . Для включения источника в набор данных CrUX он должен соответствовать двум требованиям:
Вы можете убедиться в доступности своего сайта, запустив аудит Lighthouse и просмотрев результаты по категориям SEO. Ваш сайт не будет доступен для поиска, если ваша корневая страница не проходит индексацию, страница заблокирована для индексации или проверка HTTP-статуса страницы завершилась неудачей .
Если источник информации признан общедоступным, то отзывы пользователей на всех страницах этого источника суммируются на уровне источника, независимо от доступности отдельных страниц. Все эти отзывы учитываются при расчете необходимого уровня популярности источника.
Для целей запросов обратите внимание, что все источники в наборе данных CrUX написаны строчными буквами.
Страница
Требования к странице для включения в набор данных CrUX такие же, как и к источникам:
Вы можете проверить доступность страницы, запустив аудит Lighthouse и просмотрев результаты по категориям SEO. Ваша страница не будет доступна для поиска, если она не прошла проверку на индексацию, заблокирована для индексации или имеет неудачные результаты проверки HTTP-статуса .
Если страница общедоступна для некоторых пользователей, но в некоторых случаях возвращает HTTP-статус, не увенчавшийся успехом, то такие возможности не будут включены в CrUX.
В URL-адресах страниц обычно присутствуют дополнительные идентификаторы, включая параметры строки запроса, такие как ?utm_medium=email , и фрагменты, например, #main . Эти идентификаторы удаляются из URL-адреса в наборе данных CrUX, чтобы все пользовательские взаимодействия на странице были объединены. Это полезно для страниц, которые в противном случае не достигли бы порога популярности, если бы для одной и той же страницы существовало множество разрозненных вариантов URL-адресов. Следует отметить, что в редких случаях это может неожиданно объединить взаимодействия для разных страниц; например, если параметры ?productID=101 и ?productID=102 представляют разные страницы.
В CrUX оценка страниц производится на основе метрики страницы верхнего уровня. Страницы, встроенные в iframe, не учитываются отдельно в CrUX, но вносят вклад в метрики страницы верхнего уровня. Например, если https://www.example.com/page.html встраивает https://www.example.com/frame.html в iframe, то page.html будет представлена в CrUX (при соблюдении других критериев соответствия), а frame.html нет . И если у frame.html низкий показатель CLS , то CLS будет учитываться при измерении CLS для page.html . CrUX — это отчет Chrome о пользовательском опыте , и пользователь может даже не знать, что это iframe. Поэтому пользовательский опыт измеряется на странице верхнего уровня — так, как её видит пользователь.
Архитектура веб-сайта может усложнить представление его данных в CrUX. Например, одностраничные приложения (SPA) могут использовать схему перехода между страницами на основе JavaScript, в отличие от традиционной навигации по страницам с помощью привязок. Эти переходы отображаются для пользователя как новые страницы, но для Chrome и базовых API платформы весь пользовательский опыт приписывается первоначальному просмотру страницы. Это ограничение API веб-платформы, на которых построен CrUX; подробнее см. раздел «Как архитектура SPA влияет на основные параметры веб-приложений» на web.dev.
Пользователь
Для того чтобы опыт пользователя был включен в набор данных CrUX, он должен соответствовать следующим критериям:
- Включить отчеты по статистике использования .
- Синхронизируйте историю их браузера .
- Пароль для синхронизации не установлен.
- Используйте поддерживаемую платформу.
В настоящее время поддерживаются следующие платформы:
- Настольные версии Chrome, включая операционные системы Windows, macOS, ChromeOS и Linux.
- Версии Chrome для Android, включая мобильные приложения, использующие пользовательские вкладки и WebAPK-файлы .
Есть несколько важных исключений, данные по которым не попадают в набор данных CrUX:
- Chrome на iOS.
- Приложения для Android, использующие WebView.
- Другие браузеры на основе Chromium (например, Microsoft Edge ).
Chrome не публикует данные о доле пользователей, соответствующих этим критериям. Подробнее о собираемых нами данных можно узнать в Chrome .
Ускоренные мобильные страницы (AMP)
Страницы, созданные с использованием AMP, включаются в набор данных CrUX, как и любые другие веб-страницы. Начиная с релиза CrUX в июне 2020 года , страницы, обслуживаемые с использованием AMP-кэша и/или отображаемые в AMP-просмотрщике , также включаются и приписываются URL-адресу страницы издателя.
Качество данных
Данные в CrUX проходят небольшую обработку, чтобы обеспечить их статистическую точность, хорошую структуру и упростить запросы.
Фильтрация
Набор данных CrUX отфильтрован для обеспечения статистической достоверности представленных данных. Это может привести к исключению из набора данных целых страниц или источников.
В дополнение к критериям приемлемости , применяемым к источникам и страницам, применяется дополнительная фильтрация сегментов в данных:
Источники или страницы, у которых более 20% общего трафика исключено из-за недопустимых комбинаций параметров, полностью исключаются из набора данных.
Поскольку глобальный набор данных охватывает опыт пользователей из всех стран, комбинации параметров, которые не соответствуют критериям популярности на уровне страны, все же могут быть включены в глобальный набор данных при условии достаточной популярности.
Фаззинг
Для предотвращения обратного проектирования конфиденциальных данных, таких как общий объем трафика, в набор данных вносится небольшая доля случайности. Это не влияет на точность сводной статистики.
Точность
Большинство метрических значений в наборе данных CrUX представлены в виде гистограмм значений и размеров интервалов, где значение гистограммы представляет собой долю всех включенных сегментов, сумма которых равна 1. Размеры интервалов — это числа с плавающей запятой от 1,0 до 0,0001.
Ширина интервалов гистограммы нормализована для упрощения запросов и визуализации данных. Это означает, что более крупные интервалы могут быть разделены на более мелкие, которые в равной степени разделяют исходную плотность, чтобы поддерживать постоянную ширину интервалов.
Лицензия
Наборы данных CrUX от Google распространяются под лицензией Creative Commons Attribution 4.0 International License .