CrUX ב-BigQuery

כאן מוסבר איך נתוני CrUX מובנים ב-BigQuery.

מבוא

הנתונים הגולמיים שמאחורי דוח חוויית המשתמש ב-Chrome ‏ (CrUX) זמינים ב-BigQuery, מסד נתונים שמארח ב-Google Cloud.

‫CrUX ב-BigQuery מאפשר למשתמשים לשלוח שאילתות ישירות למערך הנתונים המלא משנת 2017, למשל כדי לנתח מגמות, להשוות בין טכנולוגיות אינטרנט ולבצע השוואה בין דומיינים.

הנתונים מובְנים לפי מהדורות חודשיות, ויש גם מספר טבלאות סיכום שמאפשרות גישה מהירה יותר לנתונים לצורך שאילתות.

נתוני BigQuery הם הבסיס ללוח הבקרה של CrUX, שמאפשר לכם להמחיש את הנתונים האלה בלי לכתוב שאילתות SQL.

גישה למערך הנתונים

כדי להשתמש ב-BigQuery, צריך חשבון Google Cloud וידע בסיסי ב-SQL. הגישה למערך הנתונים של CrUX ב-BigQuery היא בחינם, ואפשר לעיין בו עד למגבלות של התוכנית ללא תשלום, שמתחדשת מדי חודש ומסופקת על ידי BigQuery. בנוסף, משתמשים חדשים ב-Google Cloud עשויים להיות זכאים לקרדיט על הרשמה לכיסוי הוצאות מעבר לשימוש ברמה החינמית. שימו לב: צריך לספק כרטיס אשראי לפרויקט ב-Google Cloud. למידע נוסף, אפשר לעיין במאמר למה צריך לספק כרטיס אשראי?.

אם זו הפעם הראשונה שאתם משתמשים ב-BigQuery, אתם צריכים לבצע את השלבים הבאים כדי להגדיר פרויקט:

  1. עוברים אל Create a Project (יצירת פרויקט) במסוף Google Cloud.
  2. נותנים לפרויקט החדש שם כמו My Chrome UX Report (דוח חוויית המשתמש ב-Chrome) ולוחצים על Create (יצירה).
  3. אם מוצגת בקשה, מציינים את פרטי החיוב.
  4. מעבר אל מערך הנתונים של CrUX ב-BigQuery

עכשיו אפשר להתחיל להריץ שאילתות במערך הנתונים.

ארגון פרויקטים

נתוני CrUX ב-BigQuery מתפרסמים ביום שלישי השני של החודש הבא. כל חודש מתפרסמת טבלה חדשה בקטע chrome-ux-report.all. יש גם מספר טבלאות מגובות שמספקות נתונים סטטיסטיים מסכמים לכל חודש.

סכימת טבלה מפורטת

הטבלאות הגולמיות לכל מדינה ולמערך הנתונים all מסופקות לפי שנה וחודש.

טבלאות גולמיות

הסכימה של הטבלאות הגולמיות היא כדלקמן:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

סכימת טבלאות מהותיות

טבלאות מגובות מספקות גישה קלה יותר לנתוני סיכום לפי מספר מאפיינים מרכזיים. לא מוצגים היסטוגרמות, אלא נתוני הביצועים מצטברים לשברים לפי הערכת הביצועים וערך האחוזון ה-75. בדוגמה הזו מוצגת קבוצה של שורות לדוגמה מהטבלה metrics_summary:

yyyymm מקור fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1,600
202203 https://example.com 0.9209 0.052 0.0274 1,400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

הנתון הזה מראה שבמערך הנתונים 202204, ‏ 90.56% מהחוויות של משתמשים אמיתיים באתר https://example.com עמדו בקריטריונים ל-LCP טוב, ושהערך המשוער של LCP באחוזון ה-75 היה 1,600ms. המהירות הזו קצת יותר נמוכה בהשוואה לחודשים הקודמים.

יש ארבע טבלאות חומרי גלם:

metrics_summary
מדדים מרכזיים לפי חודש ומקור
device_summary
מדדים מרכזיים לפי חודש, מקור וסוג מכשיר
country_summary
מדדים מרכזיים לפי חודש, מקור, סוג מכשיר ומדינה
origin_summary
רשימה של כל המקורות שנכללים במערך הנתונים

metrics_summary

הטבלה metrics_summary מכילה נתונים סטטיסטיים מסכמים לכל מקור ולכל מערך נתונים חודשי:

yyyymm
החודש של תקופת איסוף הנתונים
origin
כתובת ה-URL של מקור האתר
rank
דירוג פופולריות כללי (נכון למרץ 2021)
[small|medium|large]_cls
חלקיק התנועה לפי ספי CLS
[fast|avg|slow]_<metric>
חלק מהתנועה לפי ספי ביצועים
[low|medium|high]_rtt
חלקיק התנועה לפי ספי RTT
p75_<metric>
ערך האחוזון ה-75 של מדדי הביצועים (אלפיות שנייה)
notification_permission_[accept|deny|ignore|dismiss]
fraction of notification permission behaviors
[desktop|phone|tablet]Density
חלק מהתנועה לפי גורם צורה
[_4G|_3G|_2G|slow2G|offline]Density
חלק מהתנועה לפי סוג החיבור בפועל (מחושב מrtt היסטוגרמות מפברואר 2025, ללא נתונים אופליין)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
fraction of navigation types

device_summary

הטבלה device_summary מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary, יש:

device
גורם הצורה של המכשיר

country_summary

הטבלה country_summary מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary, יש:

country_code
קוד מדינה של שתי אותיות
device
גורם הצורה של המכשיר

origin_summary

הטבלה origin_summary מכילה רשימה של כל המקורות במערך הנתונים של CrUX. היא מתעדכנת מדי חודש עם הרשימה העדכנית של המקורות במערך הנתונים, ויש בה עמודה אחת: origin_summary.origin

מערך נתונים ניסיוני

הטבלאות במערך הנתונים הניסיוני הן עותקים מדויקים של טבלאות ברירת המחדל YYYYMM, אבל הן משתמשות בתכונות חדשות ומתקדמות יותר של BigQuery, כמו חלוקה למחיצות ואשכולות, שמאפשרות לכתוב שאילתות מהירות, פשוטות וזולות יותר.

country

מערך הנתונים experimental.country מכיל נתונים מצטברים ממערכי הנתונים country_CC, עם עמודה נוספת yyyymm לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם תוספת של העמודות date ו-country_code. כך אפשר להריץ שאילתות להשוואה ברמת המדינה לאורך זמן בלי לבצע הצטרפות לטבלאות החודשיות.

global

מערך הנתונים experimental.global מכיל נתונים מצטברים ממערך הנתונים all עם עמודה נוספת yyyymm לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם תוספת של התאריך. כך אפשר להריץ שאילתות להשוואה לאורך זמן בלי לבצע איחוד של הטבלאות החודשיות.