הוספה של מידת הדירוג לדוח CrUX ב-BigQuery

החל ממערך הנתונים של פברואר 2021, אנחנו מוסיפים מדד ניסיוני לדוח CrUX ב-BigQuery שמבדיל בין הפופולריות של מקורות לפי סדרי גודל: 1,000 המקורות המובילים, 10,000 המקורות המובילים, 100,000 המקורות המובילים, 1,000,000 המקורות המובילים וכו'.

בואו נראה איך זה נראה בפועל:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
שורה rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 100,000 90,000
4 1,000,000 900,000
15 10,000,000 7,264,371

עבור קבוצת הנתונים הגלובלית של פברואר 2021, אנחנו מקבלים 5 קטגוריות. כצפוי, בשורה 1 אנחנו רואים שיש 1,000 מקורות עם עוצמת דירוג 1,000 – 1,000 המקורות הפופולריים ביותר לפי המדד שלנו. שורה 2 עשויה להיראות מפתיעה, כי היא מציינת שיש רק 9,000 מקורות בקבוצה של 10,000 המקורות המובילים. הסיבה לכך היא שהמקורות בשורה 1 הם גם חלק מקבוצת 10,000 המקורות המובילים. כדי לבחור את 10,000 המקורות המובילים, צריך לציין בזמן השאילתה את הביטוי experimental.popularity.rank <= 10000.

מערך הנתונים מכיל גם את עוצמת הדירוג הספציפית למדינה. לדוגמה, השאילתה הזו מציגה את 10,000 המקורות הפופולריים ביותר בגרמניה.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

כדי להבין את הפוטנציאל של המדד החדש שלנו למדידת הפופולריות, נראה איך קטעי הפופולריות באינטרנט שונים מבחינת מדד ההצגה הראשונית של תוכן (FCP). לצורך השאילתה הזו, אנחנו מתייחסים לשנייה אחת כחוויית משתמש מהירה.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

לגבי מקורות עם experimental.popularity.rank <= 1000, השאילתה מסכמת את כל צפיפות הקטגוריות בתרשים ההיסטוגרמה של ערכי מדד FCP שקטנים מ-1,000ms ומחלקת את הערך הזה במספר המקורות – כלומר, היא מחשבת את האחוז הממוצע של עומסי FCP מהירים ב-1,000 המקורות הפופולריים ביותר. בשאילתה הזו, לכל המקורות יש משקל שווה, ולכן אפשר לטעון שהיא לא מושלמת. אבל נבדוק אם התוצאה רגישת לשינוי עוצמת הדירוג. לשם כך, נשנה את תנאי התנאי כך שיהיה experimental.popularity.rank <= 10000. אנחנו עושים זאת עבור 10,000, 100,000 וכן הלאה:

דירוג עוצמת המקורות אחוז ה-FCP ‏ < שנייה אחת, בממוצע על פני מקורות
1.000  53.6%
10,000 49.6%
100,000 45.9%
1,000,000 43.2%
10,000,000 39.9%

הנתון הזה מציין שיש קורלציה בין חוויית משתמש מהירה יותר באינטרנט לבין פופולריות גבוהה יותר.

במערך הנתונים של אוקטובר 2022, הנתונים האלה פוצלו עוד יותר לפי שלבי חצי דירוג. הפעלה חוזרת של השאילתה הראשונה לגבי מערך הנתונים הזה מציגה את שלבי הביניים ואת מספר המקורות בכל דרגת דירוג:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
שורה rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 100,000 50,000
6 500,000 400,000
7 1,000,000 500,000
8 5,000,000 4,000,000
9 10,000,000 5,000,000
10 50,000,000 7,637,195

מידע נוסף על שימוש ב-CrUX ב-BigQuery זמין באוסף הפתרונות של CrUX, שבו אפשר למצוא שאילתות לדוגמה נוספות. אפשר לשתף את השאילתות שלכם ולספר לנו מה מצאתם.