CrUX 方法

本節說明 CrUX 如何收集及整理使用者體驗資料。

資格條件

CrUX 資料集的核心為個別使用者體驗,並匯總為頁面層級和來源層級分佈情形。本節說明使用者資格,以及可納入資料集的網頁和來源的需求條件。必須符合所有資格條件,才能納入 PageSpeed Insights 和 CrUX API 中的網頁層級資料:使用者來源網頁。符合使用者和來源條件 (但非網頁) 的體驗,將不納入所有 CrUX 資料來源的來源層級資料中。

如果頁面和來源的資格隨時間改變,就會自動納入或從資料集中移除。目前,您無法手動提交要納入的網頁或來源。

可公開找到

網頁必須可供公開搜尋,才能納入 CrUX 資料集。

使用與搜尋引擎相同的可索引性條件,判定網頁可供公開搜尋。

符合以下「任何」條件 (包括來源資料集的根頁面) 時,網頁「無法」符合可偵測性要求:

  • 網頁在重新導向後提供 200 以外的 HTTP 狀態碼
  • 網頁會提供 HTTP X-Robots-Tag: noindex 標頭或同等標頭。
  • 文件包含 <meta name="robots" content="noindex"> 中繼標記或同等標記。

如要大致瞭解網站的索引狀態,請參閱 Google Search Console

相當熱門

如果網頁的訪客人數達到最低門檻,我們就會判定網頁的熱門程度。如果來源的所有網頁訪客數量達到最低門檻,就表示來源十分熱門。系統不會揭露確切數字,但這個數字之所以選擇,是為了確保我們有足夠的樣本,可以準確對已納入的網頁統計分佈情況。頁面和來源的數字下限相同。

不符合熱門程度門檻的網頁和來源就不會納入 CrUX 資料集。

來源

來源代表整個網站,可透過 https://www.example.com 等網址定址。來源必須符合以下兩個條件,才能納入 CrUX 資料集:

  1. 可公開找到
  2. 相當熱門

您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認是否可以偵測到來源。如果根網頁無法建立索引,當「網頁無法建立索引」或「網頁未通過 HTTP 狀態碼」稽核,Google 就不會偵測到你的網站。

如果來源經判定為可公開搜尋,則無論個別網頁是否可搜尋,系統都會在來源層級匯總所有來源網頁上符合資格的使用者體驗。這些體驗全都會計入來源的熱門程度規定。

就查詢而言,請注意,CrUX 資料集中的所有來源均為小寫。

頁面

納入 CrUX 資料集的網頁的要求與來源相同:

  1. 可公開找到
  2. 相當熱門

您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認是否可以找到網頁。如果網頁未通過「網頁無法建立索引」或「網頁未通過 HTTP 狀態碼」稽核,就表示 Google 無法偵測到你的網頁。

網頁的網址中通常會有其他 ID,包括查詢字串參數 (例如 ?utm_medium=email),以及 #main 這類片段。系統會從 CrUX 資料集的網址中移除這些 ID,以便將網頁上的所有使用者體驗匯總在一起。如果某個網頁有太多不同的網址變化版本,但不符合熱門程度門檻時,這項功能就非常實用。請注意,在極少數情況下,這可能會意外將不同網頁的體驗歸入同一組;舉例來說,?productID=101?productID=102 參數代表不同的網頁。

系統會根據頂層頁面評估 CrUX 中的網頁。以 iframe 形式納入的網頁不會另外記錄在 CrUX 中,但會計入頂層頁面的指標。舉例來說,如果 https://www.example.com/page.htmlhttps://www.example.com/frame.html 嵌入 iframe 中,則 page.html 「會」顯示在 CrUX 中 (須符合其他資格條件),但 frame.html 不會。如果 frame.htmlCLS 不佳,系統就會在評估 page.html 的 CLS 時納入該 CLS。CrUX 是 Chrome 使用者體驗報告,使用者可能甚至不知道自己是 iframe。因此,在頂層頁面評估體驗的成效,取決於使用者看到這個畫面的樣子。

網站的架構可能會使網站資料在 CrUX 中呈現方式複雜。舉例來說,單頁應用程式 (SPA) 可能會使用以 JavaScript 為基礎的路徑轉換機制在頁面間移動,而不是採用傳統錨定式頁面導覽功能。當使用者瀏覽新的網頁瀏覽內容時,系統會將轉換記錄為 Chrome 和基礎平台 API,但整個體驗都會歸功於初次網頁瀏覽。這是用於建構 CrUX 的原生網路平台 API 限制,詳情請參閱 web.dev 的 SPA 架構對 Core Web Vitals 的影響

使用者

使用者如要透過 CrUX 資料集匯總自身體驗,必須符合下列條件:

  1. 啟用使用統計資料報表
  2. 同步處理他們的瀏覽器記錄
  3. 未設定同步通關密語
  4. 請使用支援的平台。

目前支援的平台如下:

  • Chrome 電腦版,包括 Windows、MacOS、ChromeOS 和 Linux 作業系統。
  • Android 版的 Chrome,包括使用自訂分頁WebAPKs 的原生應用程式。

有一些例外情況並未提供資料給 CrUX 資料集:

  • iOS 版 Chrome。
  • 使用 WebView 的 Android 原生應用程式。
  • 其他 Chromium 瀏覽器 (例如 Microsoft Edge)。

Chrome 不會發布符合這些條件的使用者比例相關資料。如要進一步瞭解我們蒐集的資料,請參閱《Chrome 隱私權白皮書》。

Accelerated Mobile Pages (AMP)

使用 AMP 建構的網頁和其他網頁一樣,都會納入 CrUX 資料集。自 2020 年 6 月 6 月的 CrUX 版本起,系統也會擷取透過 AMP 快取和 / 或在 AMP 檢視器顯示的網頁,並將這些網頁歸因於發布者的網頁網址。

資料品質

CrUX 的資料會經過少量處理,以確保統計結果的準確性、結構良好且易於查詢。

篩選

系統會篩選 CrUX 資料集,確保呈現的資料在統計上有效。這可能會排除整個網頁或來源,導致資料集無法顯示。

除了套用至來源和網頁的資格條件外,系統也會針對資料中的區隔套用進一步的篩選條件:

如果來源或網頁佔總流量的 20% 以上,因為維度組合不符合資格,就會完全從資料集中排除。

由於全域層級資料集涵蓋來自所有國家/地區的使用者體驗,因此即使熱門程度不足,不符合特定國家/地區層級熱門條件的維度組合仍有可能納入全球層級。

模糊

系統會對資料集套用少量隨機性,以免對機密資料進行反向工程,例如總流量。這不會影響匯總統計資料的準確度。

精確度

CrUX 資料集內的大多數指標值都會以值與特徵分塊大小的直方圖表示,其中直方圖值是所有已納入區隔總和為 1 的部分。特徵分塊大小是介於 1.0 和 0.0001 之間的浮點數。

直方圖會正規化,簡化查詢並以視覺化方式呈現資料。這表示系統可能會將較大的特徵分塊分割為較小的特徵分塊,平均共用原始密度,以維持相同的特徵分塊寬度。

授權

Google 提供的 CrUX 資料集是依據創用 CC 姓名標示 4.0 國際授權授權使用。