Phần này trình bày cách CrUX thu thập và sắp xếp dữ liệu về trải nghiệm người dùng.
Điều kiện sử dụng
Ở cốt lõi của tập dữ liệu CrUX (Báo cáo trải nghiệm người dùng trên Chrome) là trải nghiệm của từng người dùng, được tổng hợp thành các bản phân phối ở cấp trang và cấp nguồn gốc. Phần này trình bày điều kiện sử dụng của người dùng và các yêu cầu đối với trang và điểm gốc để được đưa vào tập dữ liệu. Bạn phải đáp ứng tất cả các tiêu chí về điều kiện sử dụng để một trải nghiệm được đưa vào dữ liệu ở cấp trang có trong PageSpeed Insights và API CrUX: Người dùng, Điểm gốc và Trang. Những trải nghiệm đáp ứng tiêu chí Người dùng và Điểm gốc nhưng không đáp ứng tiêu chí Trang sẽ không được đưa vào dữ liệu ở cấp điểm gốc có trong tất cả nguồn dữ liệu CrUX.
Các trang và điểm gốc sẽ tự động được đưa vào hoặc xoá khỏi tập dữ liệu nếu điều kiện sử dụng của chúng thay đổi theo thời gian. Hiện tại, bạn không thể gửi trang hoặc điểm gốc theo cách thủ công để đưa vào tập dữ liệu.
Có thể phát hiện công khai
Một trang phải có thể phát hiện công khai để được xem xét đưa vào tập dữ liệu CrUX.
Một trang được xác định là có thể phát hiện công khai bằng cách sử dụng các tiêu chí khả năng được lập chỉ mục tương tự như công cụ tìm kiếm.
Một trang không thể đáp ứng yêu cầu về khả năng phát hiện nếu đáp ứng bất kỳ điều kiện nào sau đây, bao gồm cả các trang gốc cho tập dữ liệu điểm gốc:
- Trang được phân phát với mã trạng thái HTTP
khác
200(sau khi chuyển hướng). - Trang được phân phát với tiêu đề HTTP
X-Robots-Tag: noindexheader hoặc tương đương. - Tài liệu này bao gồm thẻ meta
<meta name="robots" content="noindex">hoặc tương đương.
Hãy tham khảo Google Search Console để biết thông tin tổng quan về trạng thái lập chỉ mục của trang web.
Đủ phổ biến
Một trang được xác định là đủ phổ biến nếu có số lượng khách truy cập tối thiểu. Một điểm gốc được xác định là đủ phổ biến nếu có số lượng khách truy cập tối thiểu trên tất cả các trang của điểm gốc đó. Chúng tôi không tiết lộ con số chính xác, nhưng con số này được chọn để đảm bảo rằng chúng tôi có đủ mẫu để tự tin về các bản phân phối thống kê cho các trang được đưa vào. Số lượng tối thiểu là giống nhau đối với trang và điểm gốc.
Các trang và điểm gốc không đáp ứng ngưỡng phổ biến sẽ không được đưa vào tập dữ liệu CrUX.
Điểm gốc
Một điểm gốc đại diện cho
toàn bộ trang web, có thể truy cập bằng một URL như https://www.example.com. Để được đưa vào tập dữ liệu CrUX, một điểm gốc phải đáp ứng 2 yêu cầu:
Bạn có thể xác minh rằng điểm gốc của mình có thể phát hiện được bằng cách chạy quy trình kiểm tra Lighthouse và xem kết quả của danh mục SEO. Trang web của bạn không thể phát hiện được nếu trang gốc không vượt qua quy trình kiểm tra Trang bị chặn lập chỉ mục hoặc Trang có mã trạng thái HTTP không thành công audits.
Nếu một điểm gốc được xác định là có thể phát hiện công khai, thì các trải nghiệm người dùng đủ điều kiện trên tất cả các trang của điểm gốc đó sẽ được tổng hợp ở cấp điểm gốc, bất kể khả năng được phát hiện của từng trang. Tất cả những trải nghiệm này đều được tính vào yêu cầu về mức độ phổ biến của điểm gốc.
Để phục vụ mục đích truy vấn, hãy lưu ý rằng tất cả các điểm gốc trong tập dữ liệu CrUX đều ở dạng chữ thường.
Trang
Các yêu cầu đối với một trang để được đưa vào tập dữ liệu CrUX cũng giống như điểm gốc:
Bạn có thể xác minh rằng một trang có thể phát hiện được bằng cách chạy quy trình kiểm tra Lighthouse và xem kết quả của danh mục SEO. Trang của bạn không thể phát hiện được nếu trang đó không vượt qua quy trình kiểm tra Trang bị chặn lập chỉ mục hoặc Trang có mã trạng thái HTTP không thành công audits.
Nếu trang có thể phát hiện công khai đối với một số người dùng, nhưng trả về trạng thái HTTP không thành công trong một số trường hợp, thì những trải nghiệm đó sẽ không được đưa vào CrUX.
Các trang thường có thêm giá trị nhận dạng trong URL, bao gồm các tham số chuỗi truy vấn như ?utm_medium=email và các đoạn như #main. Các giá trị nhận dạng này bị xoá khỏi URL trong tập dữ liệu CrUX để tất cả trải nghiệm của người dùng trên trang được tổng hợp lại với nhau. Điều này hữu ích đối với những trang không đáp ứng ngưỡng phổ biến nếu có nhiều biến thể URL rời rạc cho cùng một trang. Xin lưu ý rằng trong một số trường hợp hiếm gặp, điều này có thể vô tình nhóm các trải nghiệm cho các trang riêng biệt lại với nhau; ví dụ: nếu các tham số ?productID=101 và ?productID=102 đại diện cho các trang khác nhau.
Các trang trong CrUX được đo lường dựa trên trang cấp cao nhất. Các trang được đưa vào dưới dạng iframe không được báo cáo riêng trong CrUX, nhưng có đóng góp vào các chỉ số của trang cấp cao nhất. Ví dụ: nếu https://www.example.com/page.html nhúng https://www.example.com/frame.html trong một iframe, thì page.html sẽ được đại diện trong CrUX (tuỳ thuộc vào các tiêu chí khác về điều kiện sử dụng) nhưng frame.html sẽ không được. Và nếu frame.html có CLS kém thì CLS đó sẽ được đưa vào khi đo lường CLS cho page.html. CrUX là Báo cáo trải nghiệm người dùng trên Chrome và người dùng thậm chí có thể không biết đây là một iframe. Do đó, trải nghiệm được đo lường ở trang cấp cao nhất – theo cách người dùng nhìn thấy trang này.
Cấu trúc của một trang web có thể làm phức tạp cách dữ liệu của trang web đó được trình bày trong CrUX. Ví dụ: các ứng dụng một trang (SPA) có thể sử dụng một lược đồ chuyển đổi tuyến đường dựa trên JavaScript để di chuyển giữa các trang, thay vì điều hướng trang dựa trên thẻ neo thông thường. Các lượt chuyển đổi này xuất hiện dưới dạng lượt xem trang mới đối với người dùng, nhưng đối với Chrome và các API nền tảng cơ bản, toàn bộ trải nghiệm được phân bổ cho lượt xem trang ban đầu. Đây là một hạn chế của các API nền tảng web mà CrUX được xây dựng trên đó. Hãy xem bài viết Cách cấu trúc SPA ảnh hưởng đến các chỉ số Core Web Vitals trên web.dev để biết thêm thông tin.
Người dùng
Để người dùng có trải nghiệm được tổng hợp trong tập dữ liệu CrUX, họ phải đáp ứng các tiêu chí sau:
- Bật tính năng báo cáo số liệu thống kê về mức sử dụng.
- Đồng bộ hoá nhật ký trình duyệt.
- Không đặt Cụm mật khẩu đồng bộ hoá.
- Sử dụng một nền tảng được hỗ trợ.
Các nền tảng hiện được hỗ trợ là:
- Các phiên bản Chrome dành cho máy tính, bao gồm hệ điều hành Windows, macOS, ChromeOS và Linux.
- Các phiên bản Chrome dành cho Android, bao gồm cả ứng dụng di động sử dụng Thẻ tuỳ chỉnh và WebAPKs.
Có một số trường hợp ngoại lệ đáng chú ý không cung cấp dữ liệu cho tập dữ liệu CrUX:
- Chrome trên iOS.
- Ứng dụng Android sử dụng WebView.
- Các trình duyệt Chromium khác (ví dụ: Microsoft Edge).
Chrome không công bố dữ liệu về tỷ lệ người dùng đáp ứng các tiêu chí này. Bạn có thể tìm hiểu thêm về dữ liệu chúng tôi thu thập trong Chrome.
Accelerated Mobile Pages (AMP)
Các trang được xây dựng bằng AMP được đưa vào tập dữ liệu CrUX giống như mọi trang web khác. Kể từ bản phát hành CrUX tháng 6 năm 2020, các trang được phân phát bằng Bộ nhớ đệm AMP và / hoặc được kết xuất trong Trình xem AMP cũng được ghi lại và phân bổ cho URL trang của nhà xuất bản.
Chất lượng dữ liệu
Dữ liệu trong CrUX trải qua một quy trình xử lý nhỏ để đảm bảo rằng dữ liệu đó chính xác về mặt thống kê, có cấu trúc rõ ràng và dễ truy vấn hơn.
Lọc
Tập dữ liệu CrUX được lọc để đảm bảo rằng dữ liệu được trình bày là hợp lệ về mặt thống kê. Điều này có thể loại trừ toàn bộ trang hoặc điểm gốc khỏi việc xuất hiện trong tập dữ liệu.
Ngoài các tiêu chí về điều kiện sử dụng được áp dụng cho điểm gốc và trang, quy trình lọc bổ sung sẽ được áp dụng cho các phân khúc trong dữ liệu:
Các điểm gốc hoặc trang có hơn 20% tổng lưu lượng truy cập bị loại trừ do các tổ hợp phương diện không đủ điều kiện sẽ bị loại trừ hoàn toàn khỏi tập dữ liệu.
Vì tập dữ liệu ở cấp toàn cầu bao gồm trải nghiệm của người dùng từ tất cả các quốc gia, nên các tổ hợp phương diện không đáp ứng tiêu chí phổ biến ở cấp quốc gia vẫn có thể được đưa vào ở cấp toàn cầu, miễn là có đủ mức độ phổ biến.
Làm mờ
Một lượng nhỏ tính ngẫu nhiên được áp dụng cho tập dữ liệu để ngăn chặn việc phân tích ngược dữ liệu nhạy cảm, chẳng hạn như tổng lưu lượng truy cập. Điều này không ảnh hưởng đến độ chính xác của số liệu thống kê tổng hợp.
Độ chính xác
Hầu hết các giá trị chỉ số trong tập dữ liệu CrUX được biểu thị dưới dạng biểu đồ tần suất của các giá trị và kích thước nhóm, trong đó giá trị biểu đồ tần suất là một phần của tất cả các phân khúc được đưa vào, tổng bằng 1. Kích thước nhóm là các số thực dấu phẩy động từ 1.0 đến 0.0001.
Chiều rộng nhóm biểu đồ tần suất được chuẩn hoá để đơn giản hoá việc truy vấn và trực quan hoá dữ liệu. Điều này có nghĩa là các nhóm lớn hơn có thể được chia thành các nhóm nhỏ hơn, chia sẻ đồng đều mật độ ban đầu để duy trì chiều rộng nhóm nhất quán.
Giấy phép
Các tập dữ liệu CrUX của Google được cấp phép theo giấy phép Ghi công theo Creative Commons 4.0 Quốc tế.