בקטע הזה מוסבר איך CrUX אוסף ומארגן נתונים של חוויית משתמש.
זכאות
בבסיס מערך הנתונים של CrUX נמצאות חוויות משתמש פרטניות, שמצטברות להתפלגויות ברמת הדף וברמת המקור. בקטע הזה מפורטים הקריטריונים לזכאות של משתמשים והדרישות שצריכות להתקיים בדפים ובמקורות כדי שהם ייכללו במערך הנתונים. כדי שחוויית משתמש תיכלל בנתונים ברמת הדף שזמינים ב-PageSpeed Insights וב-CrUX API, צריך לעמוד בכל קריטריוני הזכאות: משתמש, מקור ודף. חוויות שעומדות בקריטריונים של המשתמש והמקור, אבל לא בקריטריון של הדף, לא נכללות בנתונים ברמת המקור שזמינים בכל המקורות של נתוני CrUX.
דפים ומקורות נתונים נכללים או מוסרים באופן אוטומטי ממערך הנתונים אם הזכאות שלהם משתנה לאורך זמן. בשלב הזה, אי אפשר לשלוח דפים או מקורות באופן ידני כדי לכלול אותם.
גלויה לכולם
כדי שדף ייכלל במערך הנתונים של CrUX, הוא צריך להיות גלוי לכולם.
הקריטריונים שקובעים אם דף מסוים גלוי לכולם הם אותם קריטריונים שקובעים אם דף מסוים זמין להוספה לאינדקס על ידי מנועי חיפוש.
דף לא עומד בדרישת הגילוי אם אחד מהתנאים הבאים מתקיים, כולל דפי השורש של מערך הנתונים המקורי:
- הדף מוצג עם קוד סטטוס של HTTP שאינו
200(אחרי הפניות אוטומטיות). - הדף מוצג עם כותרת HTTP
X-Robots-Tag: noindexאו עם כותרת שוות ערך. - המסמך כולל
<meta name="robots" content="noindex">תג meta או רכיב מקביל.
אפשר לעיין ב-Google Search Console כדי לקבל סקירה כללית של סטטוס הוספת האתר לאינדקס.
פופולרי מספיק
דף נחשב פופולרי מספיק אם יש לו מספר מינימלי של מבקרים. מקור נחשב לפופולרי מספיק אם יש לו מספר מינימלי של מבקרים בכל הדפים שלו. אנחנו לא חושפים את המספר המדויק, אבל הוא נבחר כך שיהיו לנו מספיק דוגמאות כדי להיות בטוחים בהתפלגויות הסטטיסטיות של הדפים שנכללים. המספר המינימלי זהה לדפים ולמקורות.
דפים ומקורות שלא עומדים בסף הפופולריות לא נכללים במערך הנתונים של CrUX.
מקור
מקור מייצג אתר שלם, שאפשר להגיע אליו באמצעות כתובת URL כמו https://www.example.com. כדי שמקור ייכלל במערך הנתונים של CrUX, הוא צריך לעמוד בשתי דרישות:
כדי לוודא שהמקור שלכם ניתן לגילוי, מריצים ביקורת ב-Lighthouse ובודקים את התוצאות בקטגוריית ה-SEO. אם הביקורות Page is blocked from indexing או Page has unsuccessful HTTP status code נכשלות בדף הבסיסי, לא ניתן למצוא את האתר.
אם נקבע שמקור מסוים ניתן לגילוי על ידי הציבור, חוויות המשתמשים שעומדות בדרישות בכל הדפים של המקור הזה נצברות ברמת המקור, ללא קשר ליכולת הגילוי של כל דף בנפרד. כל החוויות האלה נספרות במסגרת הדרישה לפופולריות של המקור.
לצורך שאילתות, חשוב לדעת שכל גרסאות המקור במערך הנתונים של CrUX הן באותיות קטנות.
דף
הדרישות שצריכות להתקיים כדי שדף ייכלל במערך הנתונים של CrUX זהות לדרישות שצריכות להתקיים כדי שמקור ייכלל:
כדי לוודא שאפשר למצוא דף מסוים, מריצים ביקורת של Lighthouse ובודקים את התוצאות בקטגוריית ה-SEO. אם הדף לא עובר את הביקורות Page is blocked from indexing או Page has unsuccessful HTTP status code, אי אפשר למצוא אותו.
אם הדף גלוי לציבור עבור חלק מהמשתמשים, אבל מחזיר סטטוס HTTP לא תקין בנסיבות מסוימות, חוויות המשתמש האלה לא ייכללו ב-CrUX.
בדרך כלל, כתובות URL של דפים כוללות מזהים נוספים, כולל פרמטרים של מחרוזת שאילתה כמו ?utm_medium=email וקטעים כמו #main. המזהים האלה מוסרים מכתובת ה-URL במערך הנתונים של CrUX, כדי שכל חוויות המשתמשים בדף יצטברו יחד. האפשרות הזו שימושית לדפים שלא יעמדו בסף הפופולריות אם יהיו הרבה וריאציות לא קשורות של כתובות URL לאותו דף. הערה: במקרים נדירים, יכול להיות שהמערכת תקבץ באופן לא צפוי חוויות של דפים שונים. לדוגמה, אם הפרמטרים ?productID=101 ו-?productID=102 מייצגים דפים שונים.
הדפים ב-CrUX נמדדים על סמך הדף ברמה העליונה. דפים שמוטמעים כ-iframe לא מדווחים בנפרד ב-CrUX, אבל הם משפיעים על המדדים של הדף ברמה העליונה. לדוגמה, אם דף https://www.example.com/page.html מטמיע את דף https://www.example.com/frame.html ב-iframe, אז דף page.html יוצג ב-CrUX (בכפוף לקריטריונים האחרים לזכאות), אבל דף frame.html לא יוצג. ואם ל-frame.html יש CLS נמוך, ה-CLS הזה ייכלל במדידת ה-CLS של page.html. CrUX הוא הדוח של Chrome בנושא חוויית משתמש, ומשתמשים יכולים אפילו לא לדעת שמדובר ב-iframe. לכן, חוויית המשתמש נמדדת ברמת הדף העליונה – בהתאם למה שהמשתמש רואה.
הארכיטקטורה של אתר מסוים יכולה להקשות על הצגת הנתונים שלו ב-CrUX. לדוגמה, אפליקציות אינטרנט בדף יחיד (SPA) עשויות להשתמש בסכמת מעבר בין מסלולים מבוססת-JavaScript כדי לעבור בין דפים, בניגוד לניווטים רגילים בין דפים שמבוססים על עוגנים. המעברים האלה מופיעים למשתמש כצפיות חדשות בדף, אבל ל-Chrome ולממשקי ה-API של פלטפורמת הבסיס, כל החוויה משויכת לצפייה הראשונית בדף. זו מגבלה של ממשקי ה-API של פלטפורמת האינטרנט שעליהם מבוסס CrUX. מידע נוסף זמין במאמר How SPA architectures affect Core Web Vitals באתר web.dev.
משתמש
כדי שחוויית המשתמש של משתמש מסוים תצטבר במערך הנתונים של CrUX, הוא צריך לעמוד בקריטריונים הבאים:
- מפעילים את הדיווח על נתוני השימוש.
- לסנכרן את היסטוריית הגלישה.
- לא מוגדר ביטוי סיסמה לסנכרון.
- להשתמש בפלטפורמה נתמכת.
הפלטפורמות הנתמכות כרגע הן:
- גרסאות של Chrome למחשב, כולל מערכות הפעלה Windows, macOS, ChromeOS ו-Linux.
- גרסאות Android של Chrome, כולל אפליקציות לנייד שמשתמשות בכרטיסיות מותאמות וב-WebAPKs.
יש כמה חריגים בולטים שלא מספקים נתונים למערך הנתונים של CrUX:
- Chrome ב-iOS.
- אפליקציות ל-Android שמשתמשות ב-WebView.
- דפדפני Chromium אחרים (לדוגמה, Microsoft Edge).
Chrome לא מפרסם נתונים לגבי שיעור המשתמשים שעומדים בקריטריונים האלה. מידע נוסף על הנתונים שאנחנו אוספים ב-Chrome
Accelerated Mobile Pages (AMP)
דפים שנבנו באמצעות AMP נכללים במערך הנתונים של CrUX כמו כל דף אינטרנט אחר. החל מהגרסה של CrUX מיוני 2020, גם דפים שמוצגים באמצעות מטמון AMP או שעברו עיבוד במציג AMP נכללים בנתונים, והם משויכים לכתובת ה-URL של הדף של בעל התוכן הדיגיטלי.
איכות הנתונים
הנתונים ב-CrUX עוברים עיבוד קל כדי לוודא שהם מדויקים מבחינה סטטיסטית, מובנים היטב וקל יותר להריץ עליהם שאילתות.
סינון
מערך הנתונים של CrUX מסונן כדי לוודא שהנתונים שמוצגים תקפים מבחינה סטטיסטית. יכול להיות שדפים או מקורות שלמים לא יופיעו במערך הנתונים.
בנוסף לקריטריונים לזכאות שחלים על מקורות ודפים, מתבצע סינון נוסף של פלחים בתוך הנתונים:
מקורות או דפים ש-20% או יותר מהתנועה הכוללת שלהם מוחרגים בגלל שילובים לא כשירים של מאפיינים, מוחרגים לחלוטין ממערך הנתונים.
מכיוון שקבוצת הנתונים ברמה הגלובלית כוללת חוויות משתמש מכל המדינות, יכול להיות ששילובים של מאפיינים שלא עומדים בקריטריון הפופולריות ברמת המדינה עדיין ייכללו ברמה הגלובלית, בתנאי שהם פופולריים מספיק.
בדיקת fuzz
כדי למנוע הנדסה הפוכה של נתונים רגישים, כמו נפח התנועה הכולל, מוחל על מערך הנתונים רכיב אקראי קטן. זה לא משפיע על הדיוק של נתונים סטטיסטיים מצטברים.
דיוק
רוב ערכי המדדים במערך הנתונים של CrUX מיוצגים כהיסטוגרמות של ערכים וגדלים של תאים, כאשר ערך ההיסטוגרמה הוא חלק מכל הפלחים הכלולים, והסכום שלהם הוא 1. גדלי התאים הם מספרים עשרוניים בין 1.0 ל-0.0001.
רוחבי התאים בהיסטוגרמה עוברים נורמליזציה כדי לפשט את השאילתות וההדמיה של הנתונים. כלומר, יכול להיות שפחים גדולים יפוצלו לפחים קטנים יותר, שבהם הצפיפות המקורית תתחלק באופן שווה כדי לשמור על רוחב עקבי של הפחים.
רישיון
השימוש במערכי נתונים של CrUX מבית Google מותר במסגרת רישיון Creative Commons המותנה בייחוס 4.0 בינלאומי.