Thêm độ lớn thứ hạng vào báo cáo CrUX trong BigQuery

Kể từ tập dữ liệu tháng 2 năm 2021, chúng tôi sẽ thêm một chỉ số thử nghiệm vào báo cáo CrUX trong BigQuery để phân biệt mức độ phổ biến của các nguồn gốc theo thứ tự độ lớn: 1.000 nguồn gốc hàng đầu, 10.000 nguồn gốc hàng đầu, 100.000 nguồn gốc hàng đầu, 1 triệu nguồn gốc hàng đầu, v.v.

Hãy xem cách thực hiện trong thực tế:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Hàng rank_magnitude num_origins
1 1.000 1.000
2 10.000 9.000
3 100.000 90.000
4 1.000.000 900.000
15 10.000.000 7.264.371

Đối với tập dữ liệu toàn cầu tháng 2 năm 2021, chúng ta có 5 bộ chứa. Như dự kiến, trong hàng 1, chúng ta thấy có 1.000 nguồn gốc có thứ hạng 1.000 – 1.000 nguồn gốc phổ biến nhất theo chỉ số của chúng ta. Hàng 2 có thể gây ngạc nhiên, cho biết rằng chỉ có 9.000 nguồn gốc trong tập hợp 10.000 nguồn gốc hàng đầu; điều này là do các nguồn gốc trong hàng 1 cũng là một phần của tập hợp 10.000 nguồn gốc hàng đầu. Để chọn 10.000 nguồn gốc hàng đầu, bạn cần chỉ định experimental.popularity.rank <= 10000 khi truy vấn.

Tập dữ liệu này cũng chứa thứ hạng theo quốc gia. Ví dụ: truy vấn này liệt kê 10.000 nguồn gốc phổ biến nhất ở Đức.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Để tìm hiểu tiềm năng của chỉ số mức độ phổ biến mới, hãy xem các phân khúc mức độ phổ biến trên web khác nhau như thế nào so với chỉ số hiển thị nội dung đầu tiên (FCP). Đối với truy vấn này, chúng tôi coi 1 giây là trải nghiệm nhanh cho người dùng.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

Đối với các nguồn gốc có experimental.popularity.rank <= 1000, truy vấn sẽ tính tổng tất cả mật độ bộ chứa biểu đồ cho các giá trị chỉ số FCP nhỏ hơn 1000 mili giây và chia cho số lượng nguồn gốc – tức là tính tỷ lệ phần trăm trung bình của các lượt tải FCP nhanh cho 1.000 nguồn gốc phổ biến nhất. Trong truy vấn này, tất cả các nguồn gốc đều có trọng số bằng nhau, vì vậy, có thể nói đây không phải là một truy vấn hoàn hảo. Tuy nhiên, hãy xem liệu kết quả có nhạy cảm với việc thay đổi độ lớn thứ hạng hay không, bằng cách thay đổi mệnh đề where để chỉ định experimental.popularity.rank <= 10000. Chúng ta thực hiện việc này cho 10 nghìn, 100 nghìn, v.v.:

Mức độ thứ hạng của nguồn gốc Tỷ lệ phần trăm FCP < 1 giây, tính trung bình trên các nguồn gốc
1.000  53,6%
10.000 49,6%
100.000 45,9%
1.000.000 43,2%
10.000.000 39,9%

Điều này cho thấy rằng trải nghiệm người dùng nhanh hơn trên web có liên quan đến việc được ưa chuộng hơn.

Trong tập dữ liệu tháng 10 năm 2022, chúng tôi đã chia nhỏ hơn theo các bước nửa thứ hạng. Việc chạy lại truy vấn đầu tiên cho tập dữ liệu này cho thấy các nửa bước và số lượng nguồn gốc trong mỗi thứ hạng::

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Hàng rank_magnitude num_origins
1 1.000 1.000
2 5.000 4.000
3 10.000 5.000
4 50.000 40.000
5 100.000 50.000
6 500.000 400.000
7 1.000.000 500.000
8 5.000.000 4.000.000
9 10.000.000 5.000.000
10 50.000.000 7.637.195

Tìm hiểu thêm về cách sử dụng CrUX trên BigQueryduyệt qua Sách hướng dẫn về CrUX để xem thêm các truy vấn mẫu. Hãy chia sẻ truy vấn của bạn nếu bạn muốn và cho chúng tôi biết kết quả bạn tìm thấy.