CrUX の手法

このセクションでは、CrUX がユーザー エクスペリエンス データを収集および整理する方法について説明します。

対象条件

CrUX データセットの中核となっているのは個々のユーザー エクスペリエンスであり、ページレベルとオリジン レベルの分布に集約されています。このセクションでは、ユーザーの利用資格と、データセットに含めるページとオリジンの要件について説明します。PageSpeed Insights と CrUX API のページ単位のデータ(ユーザーオリジンページ)にエクスペリエンスが含まれるようにするには、すべての利用条件を満たす必要があります。ユーザーとオリジンの基準を満たすものの、Page は満たしていないエクスペリエンスは、すべての CrUX データソースで利用できるオリジン レベルのデータに含まれません。

ページとオリジンは、時間の経過とともに適格性が変化した場合、自動的にデータセットに追加または削除されます。現時点では、ページやオリジンを手動で送信することはできません。

一般公開

ページが CrUX データセットに含まれる審査を受けるには、一般公開されている必要があります。

ページは、検索エンジンと同じインデックス登録条件を使用して、一般公開されているかどうかを判断します。

元のデータセットのルートページを含め、次の条件のいずれかが満たされている場合、ページは検出可能性の要件を満たすことができません。

  • ページに 200 以外の HTTP ステータス コード(リダイレクト後)が表示される。
  • ページは、HTTP X-Robots-Tag: noindex ヘッダーまたは同等の機能で配信されています。
  • ドキュメントに <meta name="robots" content="noindex"> メタタグまたは同等のものが含まれている。

サイトのインデックス登録ステータスの概要については、Google Search Console をご覧ください。

人気がある

ページのアクセス数が十分な場合は、そのページのユーザー数が一定であると判断されます。人気が高いと判断されるのは、すべてのページで一定数以上の訪問者を獲得しているオリジンです。正確な数は開示されていませんが、含まれるページの統計的分布を信頼するのに十分なサンプル数を確保するために選択されています。最小数は、ページとオリジンで同一です。

人気度のしきい値を満たしていないページとオリジンは、CrUX データセットに含まれません。

原点

オリジンはウェブサイト全体を表しており、https://www.example.com などの URL でアドレス指定できます。CrUX データセットにオリジンを含めるには、次の 2 つの要件を満たす必要があります。

  1. 一般公開
  2. 人気がある

オリジンが検出可能であることを確認するには、Lighthouse の監査を実行し、SEO カテゴリの結果を確認します。ルートページが「ページのインデックス登録がブロックされています」または「ページの HTTP ステータス コードに失敗した」の監査で不合格だった場合、サイトは検出されません。

オリジンが一般公開されていると判断された場合は、個々のページの検出可能性に関係なく、そのオリジンのすべてのページの対象ユーザー エクスペリエンスがオリジンレベルで集計されます。これらのエクスペリエンスはすべて、オリジンの人気度の要件に反映されます。

クエリの目的のために、CrUX データセットのオリジンはすべて小文字になっていることに留意してください。

ページ

CrUX データセットに含まれるページの要件は、オリジンと同じです。

  1. 一般公開
  2. 人気がある

ページが検出可能かどうかを確認するには、Lighthouse の監査を実行し、SEO カテゴリの結果を確認します。ページのインデックス登録がブロックされている監査、またはページの HTTP ステータス コードに失敗したの監査に失敗した場合、ページが検出されません。

ページの URL には、?utm_medium=email などのクエリ文字列パラメータや #main などのフラグメントなど、追加の識別子が含まれるのが一般的です。これらの識別子は、ページ上のユーザー エクスペリエンスがすべて集計されるように、CrUX データセットの URL から削除されます。これは、同じページ内に互いに素な URL のバリエーションが多数ある場合に、人気度のしきい値に達しないページに対して有効です。ただし、まれに異なるページのエクスペリエンスがグループ化されてしまうことがあります。たとえば、パラメータ ?productID=101?productID=102 が異なるページを表す場合などです。

CrUX のページは、トップレベルのページを基準に測定されます。iframe として含まれるページは CrUX で個別に報告されることはありませんが、トップレベルのページの指標には影響します。たとえば、https://www.example.com/page.html が iframe に https://www.example.com/frame.html を埋め込む場合、page.html は CrUX で表現されます(他の利用条件が適用されます)が、frame.html は表現されません。また、frame.htmlCLS が低い場合、page.html の CLS を測定する際に CLS が含まれます。CrUX は Chrome のユーザー エクスペリエンス レポートであり、ユーザーはこれが iframe であることに気づいていない可能性があります。したがって、エクスペリエンスはトップレベル ページで、ユーザーがこれをどのように見たかに基づいて測定されます。

ウェブサイトのアーキテクチャにより、CrUX でのデータの表示方法が複雑になる場合があります。たとえば、シングルページ アプリ(SPA)では、従来のアンカーベースのページ ナビゲーションとは異なり、JavaScript ベースのルート遷移スキームを使用してページ間を移動できます。こうした移行は、ユーザーには新しいページビューとして表示されますが、Chrome と基盤となるプラットフォームの API では、全体的なエクスペリエンスは最初のページビューによるものと見なされます。これは、CrUX が構築されているネイティブ ウェブ プラットフォーム API の制限です。詳しくは、web.dev の SPA アーキテクチャが Core Web Vitals に与える影響をご覧ください。

ユーザー

ユーザーがエクスペリエンスを CrUX データセットに集約するには、以下の条件を満たす必要があります。

  1. 使用統計情報レポートを有効にする。
  2. 閲覧履歴を同期している。
  3. 同期パスフレーズが設定されていない。
  4. サポートされているプラットフォームを使用する。

現在サポートされているプラットフォームは次のとおりです。

  • パソコン版の Chrome(Windows、MacOS、ChromeOS、Linux オペレーティング システム)
  • Chrome の Android バージョン(カスタムタブWebAPKs を使用するネイティブ アプリを含む)。

ただし、CrUX データセットにデータを提供しない例外がいくつかあります。

  • iOS 版 Chrome。
  • WebView を使用するネイティブ Android アプリ。
  • その他の Chromium ブラウザ(Microsoft Edge など)。

Chrome では、これらの条件を満たすユーザーの割合に関するデータは公開されません。Google が収集するデータについて詳しくは、Chrome のプライバシー ホワイトペーパーをご覧ください。

Accelerated Mobile Pages(AMP)

AMP で作成したページは、他のウェブページと同様に CrUX データセットに含まれます。2020 年 6 月の CrUX リリース以降、AMP Cache 経由で配信されたページと AMP ビューアでレンダリングされたページもキャプチャされ、パブリッシャーのページ URL に関連付けられます。

データ品質

CrUX のデータには少量の処理が施され、統計的に正確で、適切に構造化され、クエリが容易になるようにします。

フィルタリング

提示されたデータが統計的に有効であることを確認するために、CrUX データセットはフィルタされています。これにより、ページ全体またはオリジンがデータセットに表示されない場合があります。

オリジンとページに適用される利用条件に加えて、データ内のセグメントにはさらにフィルタリングが適用されます。

合計トラフィックの 20% 超がディメンションの不適切な組み合わせにより除外されたオリジンまたはページは、データセットから完全に除外されます。

グローバル レベルのデータセットには、すべての国のユーザー エクスペリエンスが含まれているので、人気度が十分であれば、国レベルで人気度の基準を満たしていないディメンションの組み合わせがグローバル レベルで含まれることがあります。

ファジング

総トラフィック量などのセンシティブ データのリバース エンジニアリングを防ぐため、データセットには少量のランダム性が適用されます。集計データの精度には影響しません。

適合率

CrUX データセット内のほとんどの指標値は、値とビンサイズのヒストグラムとして表されます。ヒストグラムの値は、含まれるすべてのセグメントの割合の合計が 1 になったものです。ビンのサイズは、1.0 ~ 0.0001 の浮動小数点数です。

データのクエリと可視化を簡素化するために、ヒストグラム ビンの幅は正規化されています。つまり、より大きなビンを小さな複数のビンに分割し、一貫したビン幅を維持するために、元の密度を等しく共有することができます。

ライセンス

Google の CrUX データセットは、クリエイティブ・コモンズ表示 4.0 国際ライセンスにより使用許諾されています。