Tìm hiểu cấu trúc của dữ liệu CrUX trên BigQuery.
Giới thiệu
Dữ liệu thô tạo báo cáo trải nghiệm người dùng trên Chrome (CrUX) có trong BigQuery – một cơ sở dữ liệu được lưu trữ trên Google Cloud.
CrUX trên BigQuery cho phép người dùng truy vấn trực tiếp toàn bộ tập dữ liệu từ năm 2017, chẳng hạn như để phân tích xu hướng, so sánh các công nghệ web và miền điểm chuẩn.
Dữ liệu này được cấu trúc theo bản phát hành hằng tháng, cũng như một số bảng tóm tắt để bạn dễ dàng truy cập vào việc truy vấn dữ liệu.
Dữ liệu BigQuery là cơ sở của Trang tổng quan CrUX, cho phép bạn trực quan hoá dữ liệu này mà không cần ghi truy vấn SQL.
Truy cập vào tập dữ liệu
Để sử dụng BigQuery, bạn phải có tài khoản Google Cloud và có kiến thức cơ bản về SQL. Bạn có thể truy cập miễn phí và khám phá tập dữ liệu CrUX trên BigQuery trong giới hạn của cấp độ miễn phí. Đây là cấp được gia hạn hằng tháng và do BigQuery cung cấp. Ngoài ra, người dùng mới của Google Cloud có thể đủ điều kiện nhận tín dụng đã đăng ký để chi trả các chi phí ngoài bậc miễn phí. Xin lưu ý rằng bạn phải cung cấp thẻ tín dụng cho dự án trên Google Cloud, hãy xem bài viết Tại sao tôi cần cung cấp thẻ tín dụng?.
Nếu đây là lần đầu tiên bạn sử dụng BigQuery, hãy làm theo các bước sau để thiết lập một dự án:
- Chuyển đến phần Tạo dự án trên bảng điều khiển Google Cloud.
- Đặt tên cho dự án mới, chẳng hạn như "Báo cáo trải nghiệm người dùng trên Chrome của tôi" rồi nhấp vào Tạo.
- Cung cấp thông tin thanh toán của bạn nếu được nhắc.
- Chuyển đến tập dữ liệu CrUX trên BigQuery
Bây giờ, bạn đã sẵn sàng để bắt đầu truy vấn tập dữ liệu.
Tổ chức dự án
Dữ liệu CrUX trên BigQuery được phát hành vào thứ Ba thứ hai của tháng tiếp theo. Mỗi tháng sẽ được phát hành dưới dạng bảng mới trong chrome-ux-report.all
. Ngoài ra còn có một số bảng cụ thể cung cấp số liệu thống kê tóm tắt cho từng tháng.
- "chrome-ux-report
Giản đồ bảng chi tiết
Các bảng thô cho từng quốc gia và tập dữ liệu all
được cung cấp theo năm và tháng.
Bảng thô
Các bảng thô có giản đồ sau:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Giản đồ bảng cụ thể
Các bảng cụ thể được cung cấp để dễ dàng truy cập vào dữ liệu tóm tắt theo một số phương diện chính. Không có biểu đồ nào được cung cấp, thay vào đó, dữ liệu hiệu suất được tổng hợp thành phân số bằng cách đánh giá hiệu suất và giá trị của phân vị thứ 75. Trong ví dụ này, có một tập hợp các hàng mẫu trong bảng metrics_summary
:
năm tháng | nguồn gốc | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Điều này cho thấy trong tập dữ liệu 202204, 90,56% trải nghiệm người dùng thực tế trên https://example.com
đáp ứng tiêu chí về LCP tốt và giá trị LCP thô ở bách phân vị thứ 75 là 1.600 mili giây. Mức này chậm hơn một chút so với các tháng trước.
Cung cấp 4 bảng cụ thể:
metrics_summary
- các chỉ số chính theo tháng và điểm gốc
device_summary
- các chỉ số chính theo tháng, nguồn gốc và loại thiết bị
country_summary
- các chỉ số chính theo tháng, xuất xứ, loại thiết bị và quốc gia
origin_summary
- danh sách tất cả các nguồn gốc có trong tập dữ liệu
metrics_summary
Bảng metrics_summary
chứa số liệu thống kê tóm tắt cho từng nguồn gốc và từng tập dữ liệu hằng tháng:
yyyymm
- Tháng trong kỳ thu thập dữ liệu
origin
- URL của nguồn gốc trang web
rank
- Bảng xếp hạng mức độ phổ biến tương đối (tính đến tháng 3 năm 2021)
[small|medium|large]_cls
- phân số lưu lượng truy cập theo ngưỡng CLS
[fast|avg|slow]_<metric>
- phân số lưu lượng truy cập theo ngưỡng hiệu suất
p75_<metric>
- Giá trị của chỉ số hiệu suất ở phân vị thứ 75 (mili giây)
notification_permission_[accept|deny|ignore|dismiss]
- nhóm hành vi liên quan đến quyền gửi thông báo
[desktop|phone|tablet]Density
- tỷ lệ lưu lượng truy cập theo kiểu dáng thiết bị
[_4G|_3G|_2G|slow2G|offline]Density
- phân đoạn lưu lượng truy cập theo loại kết nối hiệu quả
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- phân số các loại điều hướng
device_summary
Bảng device_summary
chứa số liệu thống kê tổng hợp theo tháng, xuất xứ, quốc gia và thiết bị. Ngoài các cột metrics_summary
còn có:
device
- Hệ số hình dạng của thiết bị
country_summary
Bảng country_summary
chứa số liệu thống kê tổng hợp theo tháng, xuất xứ, quốc gia và thiết bị. Ngoài các cột metrics_summary
còn có:
country_code
- Mã quốc gia gồm hai chữ cái
device
- Hệ số hình dạng của thiết bị
origin_summary
Bảng origin_summary
chứa danh sách tất cả các điểm gốc trong tập dữ liệu CrUX. Bảng này được cập nhật hằng tháng với danh sách các điểm gốc mới nhất trong tập dữ liệu và có một cột duy nhất: origin
.
Tập dữ liệu thử nghiệm
Các bảng trong tập dữ liệu thử nghiệm là bản sao chính xác của các bảng YYYYMM
mặc định. Tuy nhiên, các bảng này sử dụng các tính năng mới và nâng cao hơn của BigQuery, chẳng hạn như phân vùng và nhóm để giúp bạn viết truy vấn nhanh hơn, đơn giản hơn và rẻ hơn.
country
Tập dữ liệu experimental.country
chứa dữ liệu tổng hợp từ các tập dữ liệu country_CC
và có thêm cột yyyymm
cho ngày sử dụng tập dữ liệu. Giản đồ này giống với bảng thô có thêm cột ngày và country_code
, cho phép thực thi truy vấn so sánh cấp quốc gia theo thời gian mà không cần tham gia vào bảng hằng tháng.
global
Tập dữ liệu experimental.global
chứa dữ liệu tổng hợp từ tập dữ liệu all
và có thêm cột yyyymm
cho ngày dùng tập dữ liệu. Giản đồ này giống với bảng thô có thêm ngày, cho phép thực thi các truy vấn so sánh theo thời gian mà không cần phải tham gia bảng hằng tháng.