כאן מוסבר איך נתוני CrUX מובנים ב-BigQuery.
מבוא
הנתונים הגולמיים שמאחורי דוח חוויית המשתמש ב-Chrome (CrUX) זמינים ב-BigQuery, מסד נתונים שמארח ב-Google Cloud.
CrUX ב-BigQuery מאפשר למשתמשים לשלוח שאילתות ישירות למערך הנתונים המלא משנת 2017, למשל כדי לנתח מגמות, להשוות בין טכנולוגיות אינטרנט ולבצע השוואה בין דומיינים.
הנתונים מובְנים לפי מהדורות חודשיות, ויש גם מספר טבלאות סיכום שמאפשרות גישה מהירה יותר לנתונים לצורך שאילתות.
נתוני BigQuery הם הבסיס ללוח הבקרה של CrUX, שמאפשר לכם להמחיש את הנתונים האלה בלי לכתוב שאילתות SQL.
גישה למערך הנתונים
כדי להשתמש ב-BigQuery, צריך חשבון Google Cloud וידע בסיסי ב-SQL. הגישה למערך הנתונים של CrUX ב-BigQuery היא בחינם, ואפשר לעיין בו עד למגבלות של התוכנית ללא תשלום, שמתחדשת מדי חודש ומסופקת על ידי BigQuery. בנוסף, משתמשים חדשים ב-Google Cloud עשויים להיות זכאים לקרדיט על הרשמה לכיסוי הוצאות מעבר לשימוש ברמה החינמית. שימו לב: צריך לספק כרטיס אשראי לפרויקט ב-Google Cloud. למידע נוסף, אפשר לעיין במאמר למה צריך לספק כרטיס אשראי?.
אם זו הפעם הראשונה שאתם משתמשים ב-BigQuery, אתם צריכים לבצע את השלבים הבאים כדי להגדיר פרויקט:
- עוברים אל Create a Project (יצירת פרויקט) במסוף Google Cloud.
- נותנים לפרויקט החדש שם כמו My Chrome UX Report (דוח חוויית המשתמש ב-Chrome) ולוחצים על Create (יצירה).
- אם מוצגת בקשה, מציינים את פרטי החיוב.
- מעבר אל מערך הנתונים של CrUX ב-BigQuery
עכשיו אפשר להתחיל להריץ שאילתות במערך הנתונים.
ארגון פרויקטים
נתוני CrUX ב-BigQuery מתפרסמים ביום שלישי השני של החודש הבא. כל חודש מתפרסמת טבלה חדשה בקטע chrome-ux-report.all
. יש גם מספר טבלאות מגובות שמספקות נתונים סטטיסטיים מסכמים לכל חודש.
- `chrome-ux-report
סכימת טבלה מפורטת
הטבלאות הגולמיות לכל מדינה ולמערך הנתונים all
מסופקות לפי שנה וחודש.
טבלאות גולמיות
הסכימה של הטבלאות הגולמיות היא כדלקמן:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
סכימת טבלאות מהותיות
טבלאות מגובות מספקות גישה קלה יותר לנתוני סיכום לפי מספר מאפיינים מרכזיים. לא מוצגים היסטוגרמות, אלא נתוני הביצועים מצטברים לשברים לפי הערכת הביצועים וערך האחוזון ה-75. בדוגמה הזו מוצגת קבוצה של שורות לדוגמה מהטבלה metrics_summary
:
yyyymm | מקור | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1,600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1,400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
הנתון הזה מראה שבמערך הנתונים 202204, 90.56% מהחוויות של משתמשים אמיתיים באתר https://example.com
עמדו בקריטריונים ל-LCP טוב, ושהערך המשוער של LCP באחוזון ה-75 היה 1,600ms. המהירות הזו קצת יותר נמוכה בהשוואה לחודשים הקודמים.
יש ארבע טבלאות חומרי גלם:
metrics_summary
- מדדים מרכזיים לפי חודש ומקור
device_summary
- מדדים מרכזיים לפי חודש, מקור וסוג מכשיר
country_summary
- מדדים מרכזיים לפי חודש, מקור, סוג מכשיר ומדינה
origin_summary
- רשימה של כל המקורות שנכללים במערך הנתונים
metrics_summary
הטבלה metrics_summary
מכילה נתונים סטטיסטיים מסכמים לכל מקור ולכל מערך נתונים חודשי:
yyyymm
- החודש של תקופת איסוף הנתונים
origin
- כתובת ה-URL של מקור האתר
rank
- דירוג פופולריות כללי (נכון למרץ 2021)
[small|medium|large]_cls
- חלקיק התנועה לפי ספי CLS
[fast|avg|slow]_<metric>
- חלק מהתנועה לפי ספי ביצועים
[low|medium|high]_rtt
- חלקיק התנועה לפי ספי RTT
p75_<metric>
- ערך האחוזון ה-75 של מדדי הביצועים (אלפיות שנייה)
notification_permission_[accept|deny|ignore|dismiss]
- fraction of notification permission behaviors
[desktop|phone|tablet]Density
- חלק מהתנועה לפי גורם צורה
[_4G|_3G|_2G|slow2G|offline]Density
- חלק מהתנועה לפי סוג החיבור בפועל (מחושב מ
rtt
היסטוגרמות מפברואר 2025, ללא נתונים אופליין) navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- fraction of navigation types
device_summary
הטבלה device_summary
מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary
, יש:
device
- גורם הצורה של המכשיר
country_summary
הטבלה country_summary
מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary
, יש:
country_code
- קוד מדינה של שתי אותיות
device
- גורם הצורה של המכשיר
origin_summary
הטבלה origin_summary
מכילה רשימה של כל המקורות במערך הנתונים של CrUX. היא מתעדכנת מדי חודש עם הרשימה העדכנית של המקורות במערך הנתונים, ויש בה עמודה אחת: origin_summary
.origin
מערך נתונים ניסיוני
הטבלאות במערך הנתונים הניסיוני הן עותקים מדויקים של טבלאות ברירת המחדל YYYYMM
, אבל הן משתמשות בתכונות חדשות ומתקדמות יותר של BigQuery, כמו חלוקה למחיצות ואשכולות, שמאפשרות לכתוב שאילתות מהירות, פשוטות וזולות יותר.
country
מערך הנתונים experimental.country
מכיל נתונים מצטברים ממערכי הנתונים country_CC
, עם עמודה נוספת yyyymm
לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם תוספת של העמודות date ו-country_code
. כך אפשר להריץ שאילתות להשוואה ברמת המדינה לאורך זמן בלי לבצע הצטרפות לטבלאות החודשיות.
global
מערך הנתונים experimental.global
מכיל נתונים מצטברים ממערך הנתונים all
עם עמודה נוספת yyyymm
לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם תוספת של התאריך. כך אפשר להריץ שאילתות להשוואה לאורך זמן בלי לבצע איחוד של הטבלאות החודשיות.