CrUX 방법론

이 섹션에서는 CrUX가 사용자 환경 데이터를 수집하고 구성하는 방법을 설명합니다.

자격 요건

CrUX 데이터 세트의 핵심은 페이지 수준 및 출처 수준 분포로 집계되는 개별 사용자 경험입니다. 이 섹션에서는 사용자 자격요건과 데이터 세트에 포함되는 페이지 및 출처의 요구사항을 설명합니다. PageSpeed Insights 및 CrUX API(사용자, 출처, 페이지)에서 사용할 수 있는 페이지 수준 데이터에 환경이 포함되려면 모든 자격 기준을 충족해야 합니다. 사용자 및 출처 기준을 충족하지만 페이지를 충족하지 않는 환경은 모든 CrUX 데이터 소스에서 제공되는 출처 수준 데이터에 포함되지 않습니다.

시간이 지남에 따라 자격요건이 변경되면 페이지와 출처가 데이터 세트에 자동으로 포함되거나 삭제됩니다. 현재는 포함할 페이지나 출처를 수동으로 제출할 수 없습니다.

공개적으로 검색 가능

페이지가 CrUX 데이터 세트에 포함되는 것으로 간주되려면 공개적으로 검색 가능해야 합니다.

페이지는 검색엔진과 동일한 색인 생성 가능 여부 기준을 사용하여 공개적으로 검색 가능한 것으로 확인됩니다.

원본 데이터 세트의 루트 페이지를 포함하여 다음 조건 중 하나라도 충족되면 페이지가 검색 가능 여부 요구사항을 충족할 수 없습니다.

  • 페이지는 200 이외의 HTTP 상태 코드 (리디렉션 후)와 함께 제공됩니다.
  • 페이지는 HTTP X-Robots-Tag: noindex 헤더 또는 이와 동등한 헤더와 함께 제공됩니다.
  • 이 문서에는 <meta name="robots" content="noindex"> 메타 태그 또는 이와 동등한 태그가 포함되어 있습니다.

사이트의 색인 생성 상태에 관한 개요는 Google Search Console을 참고하세요.

충분히 인기 있음

페이지의 방문자 수가 최소 수준일 때 충분히 인기 있는 것으로 판단됩니다. 출처가 모든 페이지에서 최소 방문자 수가 발생해야 충분히 인기 있는 것으로 판단됩니다. 정확한 수치는 공개되지 않았지만, 포함된 페이지의 통계 분포를 확신할 수 있을 만큼 샘플이 충분하도록 선택되었습니다. 최소 수는 페이지와 출처의 경우 동일합니다.

인기도 기준을 충족하지 않는 페이지와 출처는 CrUX 데이터 세트에 포함되지 않습니다.

출발지

출처https://www.example.com와 같은 URL로 주소를 지정할 수 있는 전체 웹사이트를 나타냅니다. 출처를 CrUX 데이터 세트에 포함하려면 다음 두 가지 요구사항을 충족해야 합니다.

  1. 공개적으로 검색 가능
  2. 충분한 인기도

Lighthouse 감사를 실행하고 검색엔진 최적화 카테고리 결과를 검토하여 출처를 검색할 수 있는지 확인할 수 있습니다. 루트 페이지가 페이지 색인 생성이 차단됨 또는 페이지에 실패한 HTTP 상태 코드 감사에 실패하면 사이트를 검색할 수 없습니다.

출처가 공개적으로 검색 가능한 것으로 확인되면 개별 페이지의 검색 가능 여부와 관계없이 해당 출처의 모든 페이지에서 요건을 충족하는 사용자 환경이 출처 수준에서 집계됩니다. 이러한 모든 환경이 출처의 인기도 요구사항에 반영됩니다.

쿼리를 위해 CrUX 데이터 세트의 모든 출처는 소문자입니다.

페이지

페이지가 CrUX 데이터 세트에 포함되기 위한 요구사항은 출처와 동일합니다.

  1. 공개적으로 검색 가능
  2. 충분한 인기도

Lighthouse 감사를 실행하고 검색엔진 최적화 카테고리 결과를 검토하여 페이지를 검색할 수 있는지 확인할 수 있습니다. 페이지 색인 생성이 차단됨 또는 페이지에 실패한 HTTP 상태 코드 감사에 실패하면 페이지가 검색되지 않습니다.

페이지에는 일반적으로 ?utm_medium=email와 같은 쿼리 문자열 매개변수 및 #main과 같은 프래그먼트를 비롯한 추가 식별자가 URL에 있습니다. 이러한 식별자는 CrUX 데이터 세트의 URL에서 제거되어 페이지의 모든 사용자 경험이 함께 집계됩니다. 이는 같은 페이지에 대해 연결되지 않은 URL 변형이 많은 경우 인기도 기준을 충족하지 못하는 페이지에 유용합니다. 드물지만 ?productID=101?productID=102 매개변수가 다른 페이지를 나타내는 경우와 같이 예기치 않게 서로 다른 페이지의 환경을 그룹화할 수 있습니다.

CrUX의 페이지는 최상위 수준 페이지를 기반으로 측정됩니다. iframe으로 포함된 페이지는 CrUX에서 별도로 보고되지 않지만, 최상위 페이지의 측정항목에 기여합니다. 예를 들어 https://www.example.com/page.html에서 iframe에 https://www.example.com/frame.html를 삽입하면 page.html는 다른 자격 기준에 따라 CrUX에 표시되지만 frame.html는 표시되지 않습니다. frame.htmlCLS가 낮으면 page.html의 CLS를 측정할 때 CLS가 포함됩니다. CrUX는 Chrome 사용자 환경 보고서이며, 사용자는 이 보고서가 iframe임을 인지하지 못할 수도 있습니다. 따라서 사용자 경험은 사용자에게 표시되는 방식에 따라 최상위 수준 페이지에서 측정됩니다.

웹사이트의 아키텍처로 인해 CrUX에서 데이터가 표현되는 방식이 복잡해질 수 있습니다. 예를 들어 단일 페이지 앱 (SPA)은 기존의 앵커 기반 페이지 탐색과 달리 JavaScript 기반의 경로 전환 스키마를 사용하여 페이지 간에 이동할 수 있습니다. 이러한 전환은 사용자에게 새 페이지 조회로 표시되지만 Chrome 및 기본 플랫폼 API에는 전체 환경이 초기 페이지 조회에 기인합니다. 이는 CrUX가 빌드된 기본 웹 플랫폼 API의 제한사항입니다. 자세한 내용은 web.dev에서 SPA 아키텍처가 코어 웹 바이탈에 미치는 영향을 참고하세요.

사용자

사용자가 CrUX 데이터 세트에 경험을 집계하려면 다음 기준을 충족해야 합니다.

  1. 사용량 통계 보고를 사용 설정합니다.
  2. 브라우저 기록을 동기화합니다.
  3. 동기화 암호가 설정되지 않음
  4. 지원되는 플랫폼을 사용하세요.

현재 지원되는 플랫폼은 다음과 같습니다.

  • Windows, MacOS, ChromeOS, Linux 운영체제를 포함한 데스크톱 버전의 Chrome
  • 맞춤 탭WebAPKs를 사용하는 네이티브 앱을 포함한 Android 버전 Chrome

CrUX 데이터 세트에 데이터를 제공하지 않는 몇 가지 주목할 만한 예외가 있습니다.

  • iOS의 Chrome
  • WebView를 사용하는 네이티브 Android 앱
  • 다른 Chromium 브라우저 (예: Microsoft Edge)

Chrome은 이러한 기준을 충족하는 사용자 비율에 대한 데이터를 게시하지 않습니다. Chrome 개인 정보 보호 백서에서 Google이 수집하는 데이터에 관해 자세히 알아보세요.

Accelerated Mobile Pages(AMP)

AMP로 작성된 페이지는 다른 웹페이지와 마찬가지로 CrUX 데이터 세트에 포함됩니다. 2020년 6월 CrUX 출시부터는 AMP 캐시를 통해 게재되거나 AMP 뷰어에서 렌더링된 페이지도 캡처되며, 게시자의 페이지 URL에서 표시됩니다.

데이터 품질

CrUX의 데이터는 통계적으로 정확하고, 체계적이며, 쿼리하기 쉽도록 소량의 처리를 거칩니다.

필터링

제시된 데이터가 통계적으로 유효하도록 CrUX 데이터 세트를 필터링합니다. 이렇게 하면 전체 페이지나 출처가 데이터 세트에 표시되지 않을 수 있습니다.

출처와 페이지에 적용되는 자격 기준 외에도 다음과 같이 데이터 내의 세그먼트에도 추가 필터링이 적용됩니다.

부적격한 측정기준 조합으로 인해 제외된 총 트래픽의 20% 이상이 출처나 페이지는 데이터 세트에서 완전히 제외됩니다.

글로벌 수준의 데이터 세트에는 모든 국가의 사용자 환경이 포함되므로 인기도가 충분한 경우 국가 수준에서 인기도 기준을 충족하지 않는 측정기준의 조합도 글로벌 수준에 포함될 수 있습니다.

퍼징

총 트래픽 볼륨과 같은 민감한 정보의 리버스 엔지니어링을 방지하기 위해 데이터 세트에 소량의 임의성이 적용됩니다. 집계 통계의 정확성에는 영향을 미치지 않습니다.

정밀도

CrUX 데이터 세트 내의 대부분의 측정항목 값은 값과 구간 크기의 히스토그램으로 표현되며, 여기서 히스토그램 값은 포함된 모든 세그먼트의 비율이 1이 되는 비율입니다. 구간 크기는 1.0과 0.0001 사이의 부동 소수점 수입니다.

히스토그램 빈 너비는 정규화되어 데이터 쿼리 및 시각화를 간소화합니다. 즉, 큰 구간이 더 작은 구간으로 분할될 수 있으며, 구간 너비를 일관되게 유지하기 위해 원래 밀도를 균등하게 공유합니다.

라이선스

Google의 CrUX 데이터 세트에는 크리에이티브 커먼즈 저작자 표시 4.0 국제 라이선스에 따라 라이선스가 부여됩니다.