CrUX の手法

このセクションでは、CrUX がユーザー エクスペリエンス データを収集して整理する方法について説明します。

利用資格

CrUX データセットの中核となるのは個々のユーザー エクスペリエンスで、これらはページレベルとオリジンレベルの分布に集計されます。このセクションでは、ユーザーの利用資格と、ページとオリジンがデータセットに含まれるための要件について説明します。PageSpeed Insights と CrUX API で利用できるページレベルのデータにエクスペリエンスを含めるには、 ユーザーオリジンページに関するすべての利用資格を満たす必要があります。ユーザーとオリジンの条件を満たしていても、ページの条件を満たしていないエクスペリエンスは、すべての CrUX データソースで利用できるオリジンレベルのデータには含まれません。

ページとオリジンは、利用資格が変更されると、データセットに自動的に追加または削除されます。現時点では、ページやオリジンを手動で送信して含めることはできません。

一般公開で検索可能

CrUX データセットに含めるには、ページが一般公開で検索可能である必要があります。

ページが一般公開で検索可能かどうかは、検索エンジンと同じ インデックス登録可能性 の基準を使用して判断されます。

オリジン データセットのルートページを含め、次の条件のいずれか を満たす場合、ページは検索可能性の要件を満たすことはできません

  • ページが HTTP ステータス コード 以外の 200 で配信される(リダイレクト後)。
  • ページが HTTP X-Robots-Tag: noindex ヘッダー または同等のヘッダーで配信される。
  • ドキュメントに <meta name="robots" content="noindex"> メタタグ または同等のタグが含まれている。

サイトのインデックス登録ステータスの概要については、Google Search Console をご覧ください。

十分に人気がある

ページは、訪問者数が最小数に達している場合に、十分に人気があると判断されます。オリジンは、すべてのページで訪問者数が最小数に達している場合に、十分に人気があると判断されます。正確な数は公開されていませんが、含まれるページの統計分布に自信を持てるだけの十分なサンプル数を確保できるように選択されています。最小数は、ページとオリジンで同じです。

人気度のしきい値を満たしていないページとオリジンは、CrUX データセットに含まれません。

出発地

オリジン は、 アドレス指定可能なウェブサイト全体を表します。URL は https://www.example.com のようになります。オリジンが CrUX データセットに含まれるには、次の 2 つの要件を満たす必要があります。

  1. 一般公開で検索可能
  2. 十分に人気がある

オリジンが検索可能かどうかを確認するには、 Lighthouse の監査を実行して、SEO カテゴリ の結果を確認します。ルートページが 「 _ページがインデックスに登録されない_ 」または 「 _ページに設定されている HTTP ステータス コードが正しくありません_ 」 の監査に合格しない場合、サイトは検索可能ではありません。

オリジンが一般公開で検索可能であると判断された場合、そのオリジンのすべてのページで要件を満たすユーザー エクスペリエンスは、個々のページの検索可能性に関係なく、オリジンレベルで集計されます。これらのエクスペリエンスはすべて、オリジンの人気度の要件にカウントされます。

クエリを実行する際は、CrUX データセット内のすべてのオリジンが小文字であることに注意してください。

ページ

ページ が CrUX データセットに含まれるための要件は、オリジンと同じです。

  1. 一般公開で検索可能
  2. 十分に人気がある

ページが検索可能かどうかを確認するには、 Lighthouse の監査を実行して、SEO カテゴリ の結果を確認します。ページが 「 _ページがインデックスに登録されない_ 」または 「 _ページに設定されている HTTP ステータス コードが正しくありません_ 」 の監査に合格しない場合、ページは検索可能ではありません。

一部のユーザーに対してページが一般公開で検索可能であっても、状況によっては成功以外の HTTP ステータスが返される場合、それらのエクスペリエンスは CrUX に含まれません。

ページには通常、?utm_medium=email などのクエリ文字列パラメータや #main などのフラグメントを含む追加の識別子があります。これらの識別子は CrUX データセットの URL から削除され、ページ上のすべてのユーザー エクスペリエンスがまとめて集計されます。これは、同じページに対して URL のバリエーションが多数あり、人気度のしきい値を満たさない場合に便利です。まれに、パラメータ ?productID=101?productID=102 が異なるページを表す場合など、異なるページのエクスペリエンスが誤ってグループ化されることがあります。

CrUX のページは、最上位のページに基づいて測定されます。iframe として含まれるページは CrUX で個別にレポートされませんが、最上位ページの指標に貢献します。たとえば、https://www.example.com/page.htmlhttps://www.example.com/frame.html を iframe に埋め込んでいる場合、page.html は CrUX で表されますが(他の利用資格を満たしている場合)、frame.html は表されません。また、frame.htmlCLS が低い場合、page.html の CLS を測定する際に CLS が含まれます。CrUX は Chrome ユーザー エクスペリエンス レポートであり、ユーザーはこれが iframe であることに気づかない可能性があります。 そのため、エクスペリエンスは最上位のページで測定されます。これは、ユーザーがどのように認識しているかによって異なります。

ウェブサイトのアーキテクチャによって、CrUX でのデータの表現方法が複雑になることがあります。たとえば、シングルページ アプリ(SPA)では、従来のアンカーベースのページ ナビゲーションとは異なり、JavaScript ベースのルート遷移スキームを使用してページ間を移動することがあります。 これらの遷移はユーザーには新しいページビューとして表示されますが、Chrome と基盤となるプラットフォーム API では、エクスペリエンス全体が最初のページビューに起因します。これは、CrUX の構築に使用されるウェブ プラットフォーム API の制限です。詳細については、web.dev の SPA アーキテクチャが Core Web Vitals に与える影響をご覧ください。

ユーザー

ユーザー のエクスペリエンスが CrUX データセットに集計されるには、次の条件を満たす必要があります。

  1. 使用統計情報のレポートを有効にする。
  2. ブラウザの履歴を同期する。
  3. 同期パスフレーズを設定していない。
  4. サポートされているプラットフォームを使用する。

現在サポートされているプラットフォームは次のとおりです。

  • Windows、macOS、ChromeOS、Linux オペレーティング システムを含む Chrome のデスクトップ バージョン。
  • WebAPKs

CrUX データセットにデータを提供しない注目すべき例外がいくつかあります。

  • Chrome(iOS)。
  • WebView を使用する Android アプリ。
  • その他の Chromium ブラウザ(Microsoft Edge など)。

Chrome は、これらの条件を満たすユーザーの割合に関するデータを公開していません。収集するデータの詳細については、Chrome をご覧ください

Accelerated Mobile Pages(AMP)

AMP で作成されたページは、他のウェブページと同様に CrUX データセットに含まれます。2020 年 6 月の CrUX リリース以降、AMP Cache を使用して配信されるページや AMP Viewer でレンダリングされるページもキャプチャされ、パブリッシャーのページ URL に起因します。

データ品質

CrUX のデータは、統計的に正確で、構造化され、クエリを実行しやすくするために、多少の処理が行われます。

フィルタリング

CrUX データセットは、提示されるデータが統計的に有効であることを確認するためにフィルタされます。これにより、ページまたはオリジン全体がデータセットに表示されないことがあります。

オリジンとページに適用される利用資格に加えて、データ内のセグメントにはさらにフィルタが適用されます。

ディメンションの組み合わせが無効なため、合計トラフィックの 20% 以上が除外されているオリジンまたはページは、データセットから完全に除外されます。

グローバル レベルのデータセットにはすべての国のユーザー エクスペリエンスが含まれるため、国レベルで人気度の条件を満たしていないディメンションの組み合わせでも、十分な人気度があればグローバル レベルで含めることができます。

ファジング

合計トラフィック量などのセンシティブ データのリバース エンジニアリングを防ぐため、データセットに多少のランダム性が適用されます。これは、集計統計の精度には影響しません。

適合率

CrUX データセット内のほとんどの指標値は、値とビンサイズのヒストグラムとして表されます。ヒストグラム値は、含まれるすべてのセグメントの合計が 1 になる割合です。ビンサイズは、1.0 ~ 0.0001 の浮動小数点数です。

ヒストグラムのビン幅は正規化されます。データのクエリと視覚化を簡単にするためです。つまり、ビン幅を一定に保つために、大きなビンを小さなビンに分割し、元の密度を均等に共有します。

ライセンス

Google の CrUX データセットは、クリエイティブ・コモンズ表示 4.0 国際ライセンスに基づいて使用が許諾されます。