הוספה של מידת הדירוג לדוח CrUX ב-BigQuery

החל ממערך הנתונים של פברואר 2021, אנחנו מוסיפים מדד ניסיוני לדוח CrUX ב-BigQuery שמבדיל בין הפופולריות של מקורות לפי סדרי גודל: 1,000 המקורות המובילים, 10,000 המקורות המובילים, 100,000 המקורות המובילים, 1,000,000 המקורות המובילים וכו'.

בואו נראה איך זה נראה בפועל:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
שורה rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 100,000 90,000
4 1,000,000 900,000
15 10,000,000 7,264,371

עבור קבוצת הנתונים הגלובלית של פברואר 2021, אנחנו מקבלים 5 קטגוריות. כצפוי, בשורה 1 אנחנו רואים שיש 1,000 מקורות עם עוצמת דירוג 1,000 – 1,000 המקורות הפופולריים ביותר לפי המדד שלנו. שורה 2 עשויה להיראות מפתיעה, כי היא מציינת שיש רק 9,000 מקורות בקבוצה של 10,000 המקורות המובילים. הסיבה לכך היא שהמקורות בשורה 1 הם גם חלק מקבוצת 10,000 המקורות המובילים. כדי לבחור את 10,000 המקורות המובילים, צריך לציין במיוחד את הניסוייות.popularity.rank <= 10000 בזמן השאילתה.

מערך הנתונים מכיל גם את עוצמת הדירוג הספציפית למדינה. לדוגמה, השאילתה הזו מפרטת את 10,000 המקורות הפופולריים ביותר בגרמניה.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

כדי להבין את הפוטנציאל של מדד הפופולריות החדש, נראה את ההבדלים בין פלחי הפופולריות באינטרנט למדד הצגת תוכן ראשוני (FCP). לצורך השאילתה הזו, אנחנו מגדירים שניות אחת כחוויית משתמש מהירה.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

לגבי מקורות עם experimental.popularity.rank <= 1000, השאילתה מסכמת את כל הצפיפויות של הקטגוריות בתרשים ההיסטוגרמה עבור ערכי מדד FCP שקטנים מ-1,000ms ומחלקת את הערך הזה במספר המקורות – כלומר, היא מחשבת את האחוז הממוצע של עומסי FCP מהירים ב-1,000 המקורות הפופולריים ביותר. בשאילתה הזו, לכל המקורות יש משקל שווה, ולכן אפשר לטעון שהיא לא מושלמת. אבל נבדוק אם התוצאה רגישת לשינוי עוצמת הדירוג. לשם כך, נשנה את תנאי התנאי כך שיהיה experimental.popularity.rank <= 10000. אנחנו עושים זאת עבור 10, 000, 000 וכן הלאה:

דירוג עוצמת המקורות אחוז FCP < 1s, בממוצע לפי מקורות
1.000  53.6%
10,000 49.6%
100,000 45.9%
1,000,000 43.2%
10,000,000 39.9%

הנתון הזה מציין שיש קורלציה בין חוויית משתמש מהירה יותר באינטרנט לבין פופולריות גבוהה יותר.

במערך הנתונים של אוקטובר 2022, החלוקה הזו מחולקת עוד יותר לפי חצי דירוג. הפעלה חוזרת של השאילתה הראשונה לגבי מערך הנתונים הזה מציגה את שלבי הביניים ואת מספר המקורות בכל רמת דירוג:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
שורה rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 100,000 50,000
6 500,000 400,000
7 1,000,000 500,000
8 5,000,000 4,000,000
9 10,000,000 5,000,000
10 50,000,000 7,637,195

מידע נוסף על שימוש ב-CrUX ב-BigQuery זמין באוסף הפתרונות של CrUX, שבו אפשר למצוא שאילתות לדוגמה נוספות. אם רוצים, אפשר לשתף שאילתות ולספר לנו מה מצאתם.