החל ממערך הנתונים של פברואר 2021, אנחנו מוסיפים מדד ניסיוני לדוח CrUX ב-BigQuery שמבדיל בין הפופולריות של מקורות לפי סדרי גודל: 1,000 המקורות המובילים, 10,000 המקורות המובילים, 100,000 המקורות המובילים, 1,000,000 המקורות המובילים וכו'.
בואו נראה איך זה נראה בפועל:
SELECT
experimental.popularity.rank AS rank_magnitude,
COUNT(DISTINCT origin) AS num_origins
FROM
`chrome-ux-report.all.202102`
GROUP BY
rank_magnitude
ORDER BY
rank_magnitude
שורה | rank_magnitude | num_origins |
---|---|---|
1 | 1,000 | 1,000 |
2 | 10,000 | 9,000 |
3 | 100,000 | 90,000 |
4 | 1,000,000 | 900,000 |
15 | 10,000,000 | 7,264,371 |
עבור קבוצת הנתונים הגלובלית של פברואר 2021, אנחנו מקבלים 5 קטגוריות. כצפוי, בשורה 1 אנחנו רואים שיש 1,000 מקורות עם עוצמת דירוג 1,000 – 1,000 המקורות הפופולריים ביותר לפי המדד שלנו. שורה 2 עשויה להיראות מפתיעה, כי היא מציינת שיש רק 9,000 מקורות בקבוצה של 10,000 המקורות המובילים. הסיבה לכך היא שהמקורות בשורה 1 הם גם חלק מקבוצת 10,000 המקורות המובילים. כדי לבחור את 10,000 המקורות המובילים, צריך לציין במיוחד את הניסוייות.popularity.rank <= 10000 בזמן השאילתה.
מערך הנתונים מכיל גם את עוצמת הדירוג הספציפית למדינה. לדוגמה, השאילתה הזו מפרטת את 10,000 המקורות הפופולריים ביותר בגרמניה.
SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000
כדי להבין את הפוטנציאל של מדד הפופולריות החדש, נראה את ההבדלים בין פלחי הפופולריות באינטרנט למדד הצגת תוכן ראשוני (FCP). לצורך השאילתה הזו, אנחנו מגדירים שניות אחת כחוויית משתמש מהירה.
SELECT
SUM(fcp.density)/count(distinct origin)
FROM
`chrome-ux-report.all.202102`,
UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
fcp.start < 1000 AND experimental.popularity.rank <= 1000
לגבי מקורות עם experimental.popularity.rank
<= 1000, השאילתה מסכמת את כל הצפיפויות של הקטגוריות בתרשים ההיסטוגרמה עבור ערכי מדד FCP שקטנים מ-1,000ms ומחלקת את הערך הזה במספר המקורות – כלומר, היא מחשבת את האחוז הממוצע של עומסי FCP מהירים ב-1,000 המקורות הפופולריים ביותר. בשאילתה הזו, לכל המקורות יש משקל שווה, ולכן אפשר לטעון שהיא לא מושלמת. אבל נבדוק אם התוצאה רגישת לשינוי עוצמת הדירוג. לשם כך, נשנה את תנאי התנאי כך שיהיה experimental.popularity.rank <= 10000. אנחנו עושים זאת עבור 10, 000, 000 וכן הלאה:
דירוג עוצמת המקורות | אחוז FCP < 1s, בממוצע לפי מקורות |
---|---|
1.000 | 53.6% |
10,000 | 49.6% |
100,000 | 45.9% |
1,000,000 | 43.2% |
10,000,000 | 39.9% |
הנתון הזה מציין שיש קורלציה בין חוויית משתמש מהירה יותר באינטרנט לבין פופולריות גבוהה יותר.
במערך הנתונים של אוקטובר 2022, החלוקה הזו מחולקת עוד יותר לפי חצי דירוג. הפעלה חוזרת של השאילתה הראשונה לגבי מערך הנתונים הזה מציגה את שלבי הביניים ואת מספר המקורות בכל רמת דירוג:
SELECT
experimental.popularity.rank AS rank_magnitude,
COUNT(DISTINCT origin) AS num_origins
FROM
`chrome-ux-report.all.202210`
GROUP BY
rank_magnitude
ORDER BY
rank_magnitude
שורה | rank_magnitude | num_origins |
---|---|---|
1 | 1,000 | 1,000 |
2 | 5,000 | 4,000 |
3 | 10,000 | 5,000 |
4 | 50,000 | 40,000 |
5 | 100,000 | 50,000 |
6 | 500,000 | 400,000 |
7 | 1,000,000 | 500,000 |
8 | 5,000,000 | 4,000,000 |
9 | 10,000,000 | 5,000,000 |
10 | 50,000,000 | 7,637,195 |
מידע נוסף על שימוש ב-CrUX ב-BigQuery זמין באוסף הפתרונות של CrUX, שבו אפשר למצוא שאילתות לדוגמה נוספות. אם רוצים, אפשר לשתף שאילתות ולספר לנו מה מצאתם.