Tìm hiểu cấu trúc của dữ liệu CrUX trên BigQuery.
Giới thiệu
Dữ liệu thô trong Báo cáo trải nghiệm người dùng trên Chrome (CrUX) có trên BigQuery, một cơ sở dữ liệu được lưu trữ trên Google Cloud.
CrUX trên BigQuery cho phép người dùng truy vấn trực tiếp toàn bộ tập dữ liệu từ năm 2017, chẳng hạn như để phân tích xu hướng, so sánh công nghệ web và miền điểm chuẩn.
Dữ liệu này được cấu trúc theo bản phát hành hằng tháng, cũng như một số bảng tóm tắt để cung cấp quyền truy cập đơn giản để truy vấn dữ liệu.
Dữ liệu BigQuery là nền tảng của Trang tổng quan CrUX, cho phép bạn trình bày trực quan dữ liệu này mà không cần ghi truy vấn SQL.
Truy cập vào tập dữ liệu
Để sử dụng BigQuery, bạn cần có tài khoản Google Cloud và kiến thức cơ bản về SQL. Bạn có thể truy cập và khám phá tập dữ liệu CrUX trên BigQuery mà không mất phí, trong phạm vi giới hạn của cấp miễn phí. BigQuery sẽ gia hạn cấp này hằng tháng. Ngoài ra, người dùng mới của Google Cloud có thể đủ điều kiện nhận khoản tín dụng khi đăng ký để chi trả các khoản chi phí ngoài gói miễn phí. Xin lưu ý rằng khách hàng phải cung cấp thẻ tín dụng cho dự án Google Cloud. Hãy xem bài viết Tại sao tôi cần cung cấp thẻ tín dụng?.
Nếu đây là lần đầu tiên bạn sử dụng BigQuery, hãy làm theo các bước sau để thiết lập dự án:
- Chuyển đến phần Tạo dự án trên Google Cloud Console.
- Đặt tên cho dự án mới của bạn là "Báo cáo trải nghiệm người dùng trên Chrome của tôi", rồi nhấp vào Tạo.
- Cung cấp thông tin thanh toán của bạn nếu được nhắc.
- Chuyển đến Tập dữ liệu CrUX trên BigQuery
Bây giờ, bạn đã sẵn sàng bắt đầu truy vấn tập dữ liệu.
Sắp xếp dự án
Dữ liệu CrUX trên BigQuery được phát hành vào thứ Ba thứ 2 của tháng tiếp theo. Mỗi tháng được phát hành dưới dạng một bảng mới trong chrome-ux-report.all
. Ngoài ra còn có một số bảng cụ thể cung cấp số liệu thống kê tóm tắt cho mỗi tháng.
- `chrome-ux-report
Giản đồ bảng chi tiết
Các bảng thô cho mỗi quốc gia và tập dữ liệu all
được cung cấp theo năm và tháng.
Bảng thô
Các bảng thô có giản đồ sau:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Giản đồ bảng cụ thể
Các bảng được tạo bản sao được cung cấp để dễ dàng truy cập vào dữ liệu tóm tắt theo một số phương diện chính. Không có biểu đồ dạng thanh được cung cấp, thay vào đó, dữ liệu hiệu suất được tổng hợp thành các phân số theo mức đánh giá hiệu suất và giá trị phân vị thứ 75. Ví dụ sau đây minh hoạ một tập hợp các hàng mẫu trong bảng metrics_summary
:
năm tháng | nguồn gốc | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Điều này cho thấy trong tập dữ liệu năm 202204, 90,56% trải nghiệm người dùng thực trên https://example.com
đáp ứng tiêu chí về LCP tốt và giá trị LCP của phân vị thứ 75 thô là 1.600 mili giây. Mức tăng này chậm hơn một chút so với các tháng trước.
Chúng tôi cung cấp 4 bảng cụ thể:
metrics_summary
- các chỉ số chính theo tháng và nguồn gốc
device_summary
- các chỉ số chính theo tháng, nguồn gốc và loại thiết bị
country_summary
- các chỉ số chính theo tháng, nguồn gốc, loại thiết bị và quốc gia
origin_summary
- danh sách tất cả nguồn gốc có trong tập dữ liệu
metrics_summary
Bảng metrics_summary
chứa số liệu thống kê tóm tắt cho mỗi nguồn gốc và mỗi tập dữ liệu hằng tháng:
yyyymm
- Tháng của khoảng thời gian thu thập dữ liệu
origin
- URL của nguồn gốc trang web
rank
- Thứ hạng mức độ phổ biến không tốt (tính đến tháng 3 năm 2021)
[small|medium|large]_cls
- tỷ lệ lưu lượng truy cập theo ngưỡng CLS
[fast|avg|slow]_<metric>
- tỷ lệ lưu lượng truy cập theo ngưỡng hiệu suất
p75_<metric>
- Giá trị phân vị thứ 75 của các chỉ số hiệu suất (mili giây)
notification_permission_[accept|deny|ignore|dismiss]
- nhóm hành vi cấp quyền gửi thông báo
[desktop|phone|tablet]Density
- tỷ lệ lưu lượng truy cập theo kiểu dáng thiết bị
[_4G|_3G|_2G|slow2G|offline]Density
- tỷ lệ lưu lượng truy cập theo loại kết nối hiệu quả
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- phân số loại điều hướng
device_summary
Bảng device_summary
chứa số liệu thống kê tổng hợp theo tháng, điểm khởi hành, quốc gia và thiết bị. Ngoài các cột metrics_summary
, còn có:
device
- Kiểu dáng của thiết bị
country_summary
Bảng country_summary
chứa số liệu thống kê tổng hợp theo tháng, điểm khởi hành, quốc gia và thiết bị. Ngoài các cột metrics_summary
, còn có:
country_code
- Mã quốc gia gồm hai chữ cái
device
- Hệ số hình dạng của thiết bị
origin_summary
Bảng origin_summary
chứa danh sách tất cả nguồn gốc trong tập dữ liệu CrUX. Bảng này được cập nhật hằng tháng với danh sách các nguồn mới nhất trong tập dữ liệu và có một cột duy nhất: origin
.
Tập dữ liệu thử nghiệm
Các bảng trong tập dữ liệu thử nghiệm là bản sao chính xác của các bảng YYYYMM
mặc định. Tuy nhiên, những bảng này sử dụng các tính năng mới và nâng cao hơn của BigQuery như phân vùng và phân cụm để bạn có thể viết các truy vấn nhanh hơn, đơn giản hơn và ít tốn kém hơn.
country
Tập dữ liệu experimental.country
chứa dữ liệu tổng hợp từ các tập dữ liệu country_CC
với cột yyyymm
bổ sung cho ngày của tập dữ liệu. Cấu trúc này giống với bảng thô, nhưng có thêm cột ngày và country_code
, cho phép thực thi các truy vấn so sánh theo thời gian ở cấp quốc gia mà không cần kết hợp các bảng hằng tháng.
global
Tập dữ liệu experimental.global
chứa dữ liệu tổng hợp từ tập dữ liệu all
với cột yyyymm
bổ sung cho ngày của tập dữ liệu. Cấu trúc này giống với bảng thô, nhưng có thêm ngày, cho phép thực thi các truy vấn so sánh theo thời gian mà không cần kết hợp các bảng hằng tháng.