מתודולוגיית CrUX

בקטע הזה מתואר איך CrUX אוספת ומארגנת נתונים על חוויית המשתמש.

הדרישות לשימוש בתכונה

הבסיס של מערך הנתונים של CrUX נמצא חוויות משתמש נפרדות, שמקובצות לפי הפצות ברמת הדף וברמת המקור. בקטע הזה מפורטות דרישות הסף שהמשתמשים צריכים לעמוד בהן ומהן הדרישות להכללת דפים ומקורות נתונים במערך הנתונים. כדי שחוויה תיכלל בנתונים ברמת הדף שזמינים ב-PageSpeed Insights וב-CrUX API: User, Origin ו-Page, בכל הקריטריונים לזכאות. חוויות המשתמש שעומדות בקריטריונים של User ו-Origin אבל לא של Page, לא נכללות בנתונים ברמת המקור שזמינים בכל מקורות הנתונים של CrUX.

דפים ומקורות נכללים או מוסרים ממערך הנתונים באופן אוטומטי אם הכשירות שלהם משתנה עם הזמן. בשלב זה אי אפשר לשלוח באופן ידני דפים או מקורות להכללה.

גלוי באופן ציבורי

כדי שנוכל לכלול את הדף במערך הנתונים של CrUX, הדף חייב להיות גלוי לכולם.

נקבע שהדף יהיה גלוי באופן ציבורי באמצעות אותם קריטריונים של התאמה לאינדקס כמו מנועי חיפוש.

הדף לא יכול לעמוד בדרישת יכולת הגילוי אם מתקיים אחד מהתנאים הבאים, כולל דפי הבסיס של מערך הנתונים המקורי:

  • הדף מוצג עם קוד סטטוס HTTP שאינו 200 (אחרי הפניות אוטומטיות).
  • הדף מוצג עם כותרת HTTP X-Robots-Tag: noindex או מקבילה.
  • המסמך כולל מטא תג <meta name="robots" content="noindex"> או תג מקביל.

קראו את Google Search Console כדי לקבל סקירה כללית של סטטוס ההוספה של האתר לאינדקס.

פופולרי מספיק

נקבע שדף מסוים פופולרי מספיק אם יש בו מספר מינימלי של מבקרים. נקבע שמקור פופולרי מספיק אם יש לו מספר מינימלי של מבקרים בכל הדפים. לא נחשף מספר מדויק, אך הוא נבחר כדי להבטיח שיש לנו מספיק מדגמים כדי להיות בטוחים בהתפלגויות הסטטיסטיות של הדפים שנכללו. המספר המינימלי זהה לדפים ולמקורות.

דפים ומקורות שלא עומדים בסף הפופולריות לא נכללים במערך הנתונים של CrUX.

מקור

origin מייצג אתר שלם, שניתן להפנות אליו באמצעות כתובת URL כמו https://www.example.com. כדי שמקור מסוים ייכלל במערך הנתונים של CrUX, עליו לעמוד בשתי דרישות:

  1. גלוי לכולם
  2. פופולריות מספיק

כדי לוודא שהמקור ניתן לגילוי, תוכלו להריץ בדיקה של Lighthouse ומעיינים בתוצאות של קטגוריית ה-SEO. האתר לא יהיה גלוי אם דף הבסיס נכשל בביקורות הדף חסום להוספה לאינדקס או לדף יש קוד סטטוס HTTP לא מוצלח.

אם נקבע שמקור כלשהו גלוי לכולם, חוויות המשתמש שעומדות בדרישות בכל הדפים של המקור נצברות ברמת המקור, ללא קשר ליכולת הגילוי של דף מסוים. כל החוויות האלה נחשבות כדי לעמוד בדרישת הפופולריות של המקור.

לצורך ביצוע שאילתות, חשוב לשים לב שכל המקורות במערך הנתונים של CrUX הם אותיות קטנות.

דף

כדי שדף ייכלל במערך הנתונים של CrUX, צריכות להיות זהות לדרישות:

  1. גלוי לכולם
  2. פופולריות מספיק

כדי לוודא שניתן לגלות דף מסוים, מריצים בדיקה של Lighthouse ובוחנים את התוצאות של קטגוריית ה-SEO. הדף לא גלוי אם הוא נכשל בביקורות הדף חסום להוספה לאינדקס או לדף יש קוד סטטוס HTTP לא תקין.

בדרך כלל, לדפים יש מזהים נוספים בכתובת ה-URL שלהם, כולל פרמטרים של מחרוזת שאילתה כמו ?utm_medium=email ומקטעים, כמו #main. המזהים האלה מוסרים מכתובת ה-URL במערך הנתונים של CrUX, כדי שכל חוויות המשתמש בדף יצטברו יחד. האפשרות הזו שימושית לדפים שאחרת לא היו עומדים בסף הפופולריות, אילו כתובות ה-URL של אותו דף היו מופרדות זו מזו בכולן. לתשומת ליבך: במקרים נדירים, יכול להיות שחוויות משתמש בדפים שונים יקובצו יחד באופן בלתי צפוי. לדוגמה, אם הפרמטרים ?productID=101 ו-?productID=102 מייצגים דפים שונים.

דפים ב-CrUX נמדדים על סמך הדף ברמה העליונה. דפים שכלולים כמסגרות iframe לא מדווחים בנפרד ב-CrUX, אבל כן תורמים למדדים של הדף ברמה העליונה. לדוגמה, אם https://www.example.com/page.html מטמיע את https://www.example.com/frame.html ב-iframe, page.html ייוצג ב-CrUX (בכפוף לשאר הקריטריונים לזכאות) אבל frame.html לא. אם ב-frame.html יש CLS נמוך, ה-CLS ייכלל במדידת ה-CLS של page.html. CrUX הוא דוח חוויית המשתמש ב-Chrome ויכול להיות שהמשתמשים אפילו לא מודעים לכך שמדובר ב-iframe. לכן חוויית השימוש נמדדת בדף ברמה העליונה – בהתאם לאופן שבו המשתמש רואה את זה.

הארכיטקטורה של אתר עשויה לסבך את האופן שבו הנתונים שלו מיוצגים ב-CrUX. לדוגמה, אפליקציות של דף יחיד (SPA) יכולות להשתמש בסכימת מעבר בין מסלולים המבוססת על JavaScript כדי לעבור בין דפים, בניגוד לניווטים מסורתיים שמבוססים על עוגן. המעברים האלה מופיעים אצל המשתמש כצפיות חדשות בדפים, אבל ב-Chrome ובממשקי ה-API של הפלטפורמה, החוויה כולה מיוחסת לצפייה הראשונית בדף. זו מגבלה של ממשקי ה-API של פלטפורמת האינטרנט המקורית שעליהם מבוסס CrUX. מידע נוסף זמין במאמר איך ארכיטקטורות SPA משפיעות על מדדי ליבה לבדיקת חוויית המשתמש באתר ב-web.dev.

משתמש

כדי שמשתמשים יוכלו לצבור חוויות שימוש במערך הנתונים של CrUX, עליהם לעמוד בקריטריונים הבאים:

  1. הפעלת דיווח על סטטיסטיקות שימוש.
  2. לסנכרן את היסטוריית הדפדפן שלהם.
  3. לא הגדרת ביטוי סיסמה לסנכרון.
  4. להשתמש בפלטפורמה נתמכת.

הפלטפורמות הנתמכות כיום הן:

  • גרסאות של Chrome למחשב שולחני, כולל מערכות ההפעלה Windows, MacOS, ChromeOS ו-Linux.
  • גרסאות Android של Chrome, כולל אפליקציות מקוריות שמשתמשות בכרטיסיות מותאמות אישית ובWebAPKs.

יש כמה מקרים חריגים בולטים שאינם מספקים נתונים למערך הנתונים של CrUX:

  • Chrome ב-iOS.
  • אפליקציות מקוריות ל-Android שמשתמשות ב-WebView.
  • בדפדפני Chromium אחרים (לדוגמה, Microsoft Edge).

Chrome לא מפרסם נתונים לגבי שיעור המשתמשים שעומדים בקריטריונים האלה. בסקירה המפורטת בנושא פרטיות ב-Chrome אפשר לקרוא מידע נוסף על הנתונים שאנחנו אוספים.

Accelerated Mobile Pages ‏(AMP)

דפים שנוצרו באמצעות AMP נכללים במערך הנתונים של CrUX כמו כל דף אינטרנט אחר. החל מגרסת CrUX בחודש יוני 2020, דפים שמוצגים דרך מטמון AMP ו / או מעובדים במציג ה-AMP מתועדים גם הם ומשויכים לכתובת ה-URL של בעל התוכן הדיגיטלי.

איכות הנתונים

הנתונים ב-CrUX עוברים מעט עיבוד כדי להבטיח שהם מדויקים מבחינה סטטיסטית, מובנים היטב וקלים להרצת שאילתות.

סינון

מערך הנתונים של CrUX מסונן כדי להבטיח שהנתונים המוצגים תקפים מבחינה סטטיסטית. בחירה באפשרות הזאת עשויה למנוע הצגה של דפים או מקורות שלמים במערך הנתונים.

בנוסף לקריטריונים לזכאות שחלים על מקורות ודפים, חל סינון נוסף על פלחים בנתונים:

מקורות או דפים שיותר מ-20% מהתנועה הכוללת שלהם מוחרגת כתוצאה משילובי מאפיינים שלא עומדים בדרישות, מוחרגים לחלוטין ממערך הנתונים.

מערך הנתונים ברמה הגלובלית כולל את חוויות המשתמשים מכל המדינות, ולכן שילובי מאפיינים שלא עומדים בקריטריוני הפופולריות ברמת המדינה עשויים עדיין להיכלל ברמה הגלובלית, בתנאי שהפופולריות של הביצועים שלהם מספיקה.

טשטוש

המערכת מחילה כמות קטנה של נתונים על מערך הנתונים כדי למנוע הנדסה הפוכה של מידע אישי רגיש, כמו נפח התנועה הכולל. אין לכך השפעה על הדיוק של הנתונים הסטטיסטיים המצטברים.

דיוק

רוב הערכים המטריים במערך הנתונים של CrUX מיוצגים כהיסטוגרמות של ערכים וגדלים של סלים, כאשר ערך ההיסטוגרמה הוא שבר מתוך כל הפלחים הכלולים ומסתכמים ב-1. גדלים של סלים הם מספרי נקודות צפות בין 1.0 ל-0.0001.

ערכי הרוחב של ההיסטוגרמה מנורמלים כדי לפשט את כתיבת השאילתות ולהציג את הנתונים. כלומר, אפשר לפצל סלים גדולים יותר לתאים קטנים יותר, שחולקים את הצפיפות המקורית שלהם באופן שווה כדי שהסלים יהיו ברוחב עקבי.

רישיון

מערכי הנתונים של CrUX של Google מורשים במסגרת רישיון Creative Commons Attribution 4.0 בינלאומי.