החל ממערך הנתונים של פברואר 2021, אנחנו מוסיפים מדד ניסיוני לדוח CrUX ב-BigQuery שמבדיל בין הפופולריות של מקורות לפי סדרי גודל: 1,000 המקורות המובילים, 10,000 המקורות המובילים, 100,000 המקורות המובילים, 1,000,000 המקורות המובילים וכו'.
בואו נראה איך זה נראה בפועל:
SELECT
experimental.popularity.rank AS rank_magnitude,
COUNT(DISTINCT origin) AS num_origins
FROM
`chrome-ux-report.all.202102`
GROUP BY
rank_magnitude
ORDER BY
rank_magnitude
שורה | rank_magnitude | num_origins |
---|---|---|
1 | 1,000 | 1,000 |
2 | 10,000 | 9,000 |
3 | 100,000 | 90,000 |
4 | 1,000,000 | 900,000 |
15 | 10,000,000 | 7,264,371 |
עבור קבוצת הנתונים הגלובלית של פברואר 2021, אנחנו מקבלים 5 קטגוריות. כצפוי, בשורה 1 אנחנו רואים שיש 1,000 מקורות עם עוצמת דירוג 1,000 – 1,000 המקורות הפופולריים ביותר לפי המדד שלנו. שורה 2 עשויה להיראות מפתיעה, כי היא מציינת שיש רק 9,000 מקורות בקבוצה של 10,000 המקורות המובילים. הסיבה לכך היא שהמקורות בשורה 1 הם גם חלק מקבוצת 10,000 המקורות המובילים. כדי לבחור את 10,000 המקורות המובילים, צריך לציין בזמן השאילתה את הביטוי experimental.popularity.rank <= 10000.
מערך הנתונים מכיל גם את עוצמת הדירוג הספציפית למדינה. לדוגמה, השאילתה הזו מציגה את 10,000 המקורות הפופולריים ביותר בגרמניה.
SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000
כדי להבין את הפוטנציאל של המדד החדש שלנו למדידת הפופולריות, נראה איך קטעי הפופולריות באינטרנט שונים מבחינת מדד ההצגה הראשונית של תוכן (FCP). לצורך השאילתה הזו, אנחנו מתייחסים לשנייה אחת כחוויית משתמש מהירה.
SELECT
SUM(fcp.density)/count(distinct origin)
FROM
`chrome-ux-report.all.202102`,
UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
fcp.start < 1000 AND experimental.popularity.rank <= 1000
לגבי מקורות עם experimental.popularity.rank
<= 1000, השאילתה מסכמת את כל צפיפות הקטגוריות בתרשים ההיסטוגרמה של ערכי מדד FCP שקטנים מ-1,000ms ומחלקת את הערך הזה במספר המקורות – כלומר, היא מחשבת את האחוז הממוצע של עומסי FCP מהירים ב-1,000 המקורות הפופולריים ביותר. בשאילתה הזו, לכל המקורות יש משקל שווה, ולכן אפשר לטעון שהיא לא מושלמת. אבל נבדוק אם התוצאה רגישת לשינוי עוצמת הדירוג. לשם כך, נשנה את תנאי התנאי כך שיהיה experimental.popularity.rank <= 10000. אנחנו עושים זאת עבור 10,000, 100,000 וכן הלאה:
דירוג עוצמת המקורות | אחוז ה-FCP < שנייה אחת, בממוצע על פני מקורות |
---|---|
1.000 | 53.6% |
10,000 | 49.6% |
100,000 | 45.9% |
1,000,000 | 43.2% |
10,000,000 | 39.9% |
הנתון הזה מציין שיש קורלציה בין חוויית משתמש מהירה יותר באינטרנט לבין פופולריות גבוהה יותר.
במערך הנתונים של אוקטובר 2022, הנתונים האלה פוצלו עוד יותר לפי שלבי חצי דירוג. הפעלה חוזרת של השאילתה הראשונה לגבי מערך הנתונים הזה מציגה את שלבי הביניים ואת מספר המקורות בכל דרגת דירוג:
SELECT
experimental.popularity.rank AS rank_magnitude,
COUNT(DISTINCT origin) AS num_origins
FROM
`chrome-ux-report.all.202210`
GROUP BY
rank_magnitude
ORDER BY
rank_magnitude
שורה | rank_magnitude | num_origins |
---|---|---|
1 | 1,000 | 1,000 |
2 | 5,000 | 4,000 |
3 | 10,000 | 5,000 |
4 | 50,000 | 40,000 |
5 | 100,000 | 50,000 |
6 | 500,000 | 400,000 |
7 | 1,000,000 | 500,000 |
8 | 5,000,000 | 4,000,000 |
9 | 10,000,000 | 5,000,000 |
10 | 50,000,000 | 7,637,195 |
מידע נוסף על שימוש ב-CrUX ב-BigQuery זמין באוסף הפתרונות של CrUX, שבו אפשר למצוא שאילתות לדוגמה נוספות. אפשר לשתף את השאילתות שלכם ולספר לנו מה מצאתם.