本節說明 CrUX 如何收集及整理使用者體驗資料。
資格條件
CrUX 資料集的核心是個別使用者體驗,這些體驗會匯總為網頁層級和來源層級的分布情形。本節說明使用者資格,以及網頁和來源納入資料集的要求。如要將體驗納入 PageSpeed Insights 和 CrUX API 提供的網頁層級資料,必須符合所有資格條件:使用者、來源和網頁。如果體驗符合使用者和來源條件,但不符合網頁條件,就不會納入所有 CrUX 資料來源提供的來源層級資料。
如果網頁和來源的資格隨著時間改變,系統會自動將其納入或從資料集中移除。目前無法手動提交網頁或來源以供收錄。
開放搜尋
網頁必須可公開探索,才能納入 Chrome 使用者體驗報告資料集。
系統會使用與搜尋引擎相同的可索引性條件,判斷網頁是否可公開探索。
如果符合任何下列條件 (包括原始資料集的根網頁),網頁無法符合可探索性規定:
- 網頁提供的 HTTP 狀態碼不是
200(重新導向後)。 - 網頁是透過 HTTP
X-Robots-Tag: noindex標頭或同等項目提供。 - 文件包含
<meta name="robots" content="noindex">中繼標記 或同等項目。
請參閱 Google Search Console,瞭解網站的索引狀態。
熱門程度足夠
如果網頁的訪客人數達到最低門檻,系統就會判定該網頁夠熱門。如果來源在所有網頁中都有最低訪客人數,就會被視為足夠熱門。我們不會公開確切數字,但會選擇足夠的樣本數,確保有足夠的資料來判斷所納入網頁的統計分布。網頁和來源的最低數量相同。
如果網頁和來源未達到熱門程度門檻,就不會納入 Chrome 使用者體驗報告資料集。
來源
來源代表整個網站,可透過 https://www.example.com 等網址存取。如要將來源納入 Chrome 使用者體驗報告資料集,必須符合下列兩項規定:
您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認來源是否可供探索。如果根網頁未通過「網頁遭到封鎖,無法編入索引」或「網頁傳回失敗的 HTTP 狀態碼」稽核,表示網站無法供探索。
如果系統判定來源可公開探索,就會匯總該來源所有網頁上符合資格的使用者體驗,並以來源層級呈現,不論個別網頁是否可探索。所有這些體驗都會計入來源的熱門程度規定。
請注意,為方便查詢,Chrome 使用者體驗報告資料集中的所有來源都是小寫。
網頁
網頁納入 Chrome 使用者體驗報告資料集的要求與來源相同:
您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認網頁是否可供探索。如果網頁未通過「網頁遭到封鎖,無法編入索引」或「網頁傳回失敗的 HTTP 狀態碼」稽核,表示網頁無法供探索。
如果網頁可供部分使用者公開探索,但在某些情況下會傳回非成功的 HTTP 狀態,則這些體驗不會納入 CrUX。
網頁的網址通常會包含其他 ID,包括查詢字串參數 (例如 ?utm_medium=email) 和片段 (例如 #main)。這些 ID 會從 CrUX 資料集的網址中移除,以便匯總網頁上的所有使用者體驗。如果相同網頁有許多不相連的網址變體,這項做法就很有用,因為網頁可能因此無法達到熱門程度門檻。請注意,在極少數情況下,這可能會意外將不同網頁的體驗歸為同一組,例如參數 ?productID=101 和 ?productID=102 代表不同網頁時。
CrUX 中的網頁是根據頂層網頁進行評估。以 iframe 形式納入的網頁不會在 CrUX 中個別回報,但會計入頂層網頁的指標。舉例來說,如果 https://www.example.com/page.html 在 iframe 中嵌入 https://www.example.com/frame.html,則 CrUX 會顯示 page.html (須符合其他資格條件),但不會顯示 frame.html。如果 frame.html 的 CLS 較差,系統在評估 page.html 的 CLS 時,就會將 frame.html 的 CLS 納入考量。CrUX 是 Chrome 使用者體驗報告,使用者可能甚至不知道這是 iframe。因此,系統會根據使用者看到的內容,從頂層網頁衡量體驗。
網站架構可能會導致 CrUX 資料的呈現方式變得複雜。舉例來說,單頁應用程式 (SPA) 可能會使用以 JavaScript 為基礎的路徑轉換機制在網頁間移動,而非傳統的錨點式網頁導覽。對使用者而言,這些轉換會顯示為新的網頁瀏覽,但對 Chrome 和基礎平台 API 而言,整個體驗都歸因於初始網頁瀏覽。這是 CrUX 建構所用的網頁平台 API 限制,詳情請參閱 web.dev 上的「單頁應用程式架構如何影響 Core Web Vitals」。
使用者
使用者必須符合下列條件,才能將體驗匯總至 CrUX 資料集:
目前支援的平台如下:
有幾個值得注意的例外狀況,不會提供資料給 Chrome 使用者體驗報告資料集:
- iOS 版 Chrome。
- 使用 WebView 的 Android 應用程式。
- 其他 Chromium 瀏覽器 (例如 Microsoft Edge)。
Chrome 不會發布符合這些條件的使用者比例資料。如要進一步瞭解 Chrome 收集的資料,請參閱相關說明。
Accelerated Mobile Pages (AMP)
使用 AMP 建構的網頁會像其他網頁一樣,納入 CrUX 資料集。自 2020 年 6 月發布 CrUX 資料集起,系統也會擷取透過 AMP 快取放送和 / 或在 AMP 檢視器中算繪的網頁,並歸因於發布商的網頁網址。
資料品質
CrUX 中的資料會經過少量處理,確保統計資料準確、結構良好,且更容易查詢。
篩選
系統會篩選 CrUX 資料集,確保顯示的資料在統計上有效。這可能會導致整個頁面或來源無法顯示在資料集中。
除了套用至來源和網頁的資格條件外,系統還會進一步篩選資料中的區隔:
如果來源或網頁因維度組合不符資格,導致超過 20% 的總流量遭到排除,系統會將這些來源或網頁完全排除在資料集之外。
由於全球層級的資料集涵蓋所有國家/地區的使用者體驗,因此只要有足夠的熱門程度,即使維度組合在國家/地區層級未達到熱門程度條件,仍可能納入全球層級。
模糊測試
系統會對資料集套用少量隨機性,防止機密資料 (例如總流量) 遭到反向工程。這不會影響匯總統計資料的準確度。
精確度
CrUX 資料集中的大多數指標值都以值和區間大小的直方圖表示,其中直方圖值是所有納入區隔的比例,加總為 1。分組大小是介於 1.0 和 0.0001 之間的浮點數。
直方圖分塊寬度會經過正規化,方便查詢及顯示資料。也就是說,較大的分塊可能會分割成較小的分塊,並平均分享原始密度,以維持一致的分塊寬度。
授權
Google 的 CrUX 資料集採用 Creative Commons 姓名標示 4.0 國際授權。