CrUX trên BigQuery

Tìm hiểu cấu trúc của dữ liệu CrUX trên BigQuery.

Giới thiệu

Dữ liệu thô tạo báo cáo trải nghiệm người dùng trên Chrome (CrUX) có trong BigQuery – một cơ sở dữ liệu được lưu trữ trên Google Cloud.

CrUX trên BigQuery cho phép người dùng truy vấn trực tiếp toàn bộ tập dữ liệu từ năm 2017, chẳng hạn như để phân tích xu hướng, so sánh các công nghệ web và miền điểm chuẩn.

Dữ liệu này được cấu trúc theo bản phát hành hằng tháng, cũng như một số bảng tóm tắt để bạn dễ dàng truy cập vào việc truy vấn dữ liệu.

Dữ liệu BigQuery là cơ sở của Trang tổng quan CrUX, cho phép bạn trực quan hoá dữ liệu này mà không cần ghi truy vấn SQL.

Truy cập vào tập dữ liệu

Để sử dụng BigQuery, bạn phải có tài khoản Google Cloud và có kiến thức cơ bản về SQL. Bạn có thể truy cập miễn phí và khám phá tập dữ liệu CrUX trên BigQuery trong giới hạn của cấp độ miễn phí. Đây là cấp được gia hạn hằng tháng và do BigQuery cung cấp. Ngoài ra, người dùng mới của Google Cloud có thể đủ điều kiện nhận tín dụng đã đăng ký để chi trả các chi phí ngoài bậc miễn phí. Xin lưu ý rằng bạn phải cung cấp thẻ tín dụng cho dự án trên Google Cloud, hãy xem bài viết Tại sao tôi cần cung cấp thẻ tín dụng?.

Nếu đây là lần đầu tiên bạn sử dụng BigQuery, hãy làm theo các bước sau để thiết lập một dự án:

  1. Chuyển đến phần Tạo dự án trên bảng điều khiển Google Cloud.
  2. Đặt tên cho dự án mới, chẳng hạn như "Báo cáo trải nghiệm người dùng trên Chrome của tôi" rồi nhấp vào Tạo.
  3. Cung cấp thông tin thanh toán của bạn nếu được nhắc.
  4. Chuyển đến tập dữ liệu CrUX trên BigQuery

Bây giờ, bạn đã sẵn sàng để bắt đầu truy vấn tập dữ liệu.

Tổ chức dự án

Dữ liệu CrUX trên BigQuery được phát hành vào thứ Ba thứ hai của tháng tiếp theo. Mỗi tháng sẽ được phát hành dưới dạng bảng mới trong chrome-ux-report.all. Ngoài ra còn có một số bảng cụ thể cung cấp số liệu thống kê tóm tắt cho từng tháng.

Giản đồ bảng chi tiết

Các bảng thô cho từng quốc gia và tập dữ liệu all được cung cấp theo năm và tháng.

Bảng thô

Các bảng thô có giản đồ sau:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Giản đồ bảng cụ thể

Các bảng cụ thể được cung cấp để dễ dàng truy cập vào dữ liệu tóm tắt theo một số phương diện chính. Không có biểu đồ nào được cung cấp, thay vào đó, dữ liệu hiệu suất được tổng hợp thành phân số bằng cách đánh giá hiệu suất và giá trị của phân vị thứ 75. Trong ví dụ này, có một tập hợp các hàng mẫu trong bảng metrics_summary:

năm tháng nguồn gốc fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Điều này cho thấy trong tập dữ liệu 202204, 90,56% trải nghiệm người dùng thực tế trên https://example.com đáp ứng tiêu chí về LCP tốt và giá trị LCP thô ở bách phân vị thứ 75 là 1.600 mili giây. Mức này chậm hơn một chút so với các tháng trước.

Cung cấp 4 bảng cụ thể:

metrics_summary
các chỉ số chính theo tháng và điểm gốc
device_summary
các chỉ số chính theo tháng, nguồn gốc và loại thiết bị
country_summary
các chỉ số chính theo tháng, xuất xứ, loại thiết bị và quốc gia
origin_summary
danh sách tất cả các nguồn gốc có trong tập dữ liệu

metrics_summary

Bảng metrics_summary chứa số liệu thống kê tóm tắt cho từng nguồn gốc và từng tập dữ liệu hằng tháng:

yyyymm
Tháng trong kỳ thu thập dữ liệu
origin
URL của nguồn gốc trang web
rank
Bảng xếp hạng mức độ phổ biến tương đối (tính đến tháng 3 năm 2021)
[small|medium|large]_cls
phân số lưu lượng truy cập theo ngưỡng CLS
[fast|avg|slow]_<metric>
phân số lưu lượng truy cập theo ngưỡng hiệu suất
p75_<metric>
Giá trị của chỉ số hiệu suất ở phân vị thứ 75 (mili giây)
notification_permission_[accept|deny|ignore|dismiss]
nhóm hành vi liên quan đến quyền gửi thông báo
[desktop|phone|tablet]Density
tỷ lệ lưu lượng truy cập theo kiểu dáng thiết bị
[_4G|_3G|_2G|slow2G|offline]Density
phân đoạn lưu lượng truy cập theo loại kết nối hiệu quả
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
phân số các loại điều hướng

device_summary

Bảng device_summary chứa số liệu thống kê tổng hợp theo tháng, xuất xứ, quốc gia và thiết bị. Ngoài các cột metrics_summary còn có:

device
Hệ số hình dạng
của thiết bị

country_summary

Bảng country_summary chứa số liệu thống kê tổng hợp theo tháng, xuất xứ, quốc gia và thiết bị. Ngoài các cột metrics_summary còn có:

country_code
Mã quốc gia gồm hai chữ cái
device
Hệ số hình dạng
của thiết bị

origin_summary

Bảng origin_summary chứa danh sách tất cả các điểm gốc trong tập dữ liệu CrUX. Bảng này được cập nhật hằng tháng với danh sách các điểm gốc mới nhất trong tập dữ liệu và có một cột duy nhất: origin.

Tập dữ liệu thử nghiệm

Các bảng trong tập dữ liệu thử nghiệm là bản sao chính xác của các bảng YYYYMM mặc định. Tuy nhiên, các bảng này sử dụng các tính năng mới và nâng cao hơn của BigQuery, chẳng hạn như phân vùngnhóm để giúp bạn viết truy vấn nhanh hơn, đơn giản hơn và rẻ hơn.

country

Tập dữ liệu experimental.country chứa dữ liệu tổng hợp từ các tập dữ liệu country_CC và có thêm cột yyyymm cho ngày sử dụng tập dữ liệu. Giản đồ này giống với bảng thô có thêm cột ngày và country_code, cho phép thực thi truy vấn so sánh cấp quốc gia theo thời gian mà không cần tham gia vào bảng hằng tháng.

global

Tập dữ liệu experimental.global chứa dữ liệu tổng hợp từ tập dữ liệu all và có thêm cột yyyymm cho ngày dùng tập dữ liệu. Giản đồ này giống với bảng thô có thêm ngày, cho phép thực thi các truy vấn so sánh theo thời gian mà không cần phải tham gia bảng hằng tháng.