این بخش نحوه جمعآوری و سازماندهی دادههای تجربه کاربری توسط CrUX را مستند میکند.
واجد شرایط بودن
در هسته مجموعه دادههای CrUX، تجربیات کاربری فردی قرار دارند که در توزیعهای سطح صفحه و سطح مبدا تجمیع شدهاند. این بخش، واجد شرایط بودن کاربر و الزامات مربوط به صفحات و مبداها برای گنجاندن در مجموعه دادهها را مستند میکند. برای اینکه یک تجربه در دادههای سطح صفحه موجود در PageSpeed Insights و CrUX API شامل شود، باید تمام معیارهای واجد شرایط بودن رعایت شوند: کاربر ، مبدا و صفحه . تجربیاتی که معیارهای کاربر و مبدا را برآورده میکنند اما معیارهای صفحه را ندارند، در دادههای سطح مبدا موجود در تمام منابع داده CrUX گنجانده نمیشوند.
صفحات و منابع اصلی در صورت تغییر شرایطشان در طول زمان، به طور خودکار از مجموعه دادهها حذف یا اضافه میشوند. در حال حاضر، شما نمیتوانید صفحات یا منابع اصلی را به صورت دستی برای اضافه شدن ارسال کنید.
قابل کشف عمومی
یک صفحه باید به صورت عمومی قابل کشف باشد تا برای گنجاندن در مجموعه دادههای CrUX در نظر گرفته شود.
یک صفحه با استفاده از همان معیارهای ایندکسپذیری موتورهای جستجو، برای عموم قابل کشف تعیین میشود.
اگر هر یک از شرایط زیر برآورده شود، یک صفحه نمیتواند الزام قابلیت کشف را برآورده کند، از جمله صفحات ریشه برای مجموعه دادههای مبدا:
- این صفحه با کد وضعیت HTTP غیر از
200(پس از ریدایرکتها) ارائه میشود. - این صفحه با یک هدر HTTP
X-Robots-Tag: noindexیا معادل آن ارائه میشود. - این سند شامل یک متا تگ
<meta name="robots" content="noindex">یا معادل آن است.
برای بررسی کلی وضعیت ایندکس شدن سایت خود، به کنسول جستجوی گوگل مراجعه کنید.
به اندازه کافی محبوب
یک صفحه در صورتی به اندازه کافی محبوب است که حداقل تعداد بازدیدکننده داشته باشد. یک منبع در صورتی به اندازه کافی محبوب است که حداقل تعداد بازدیدکننده در تمام صفحات خود داشته باشد. عدد دقیقی فاش نشده است، اما این عدد انتخاب شده است تا اطمینان حاصل شود که نمونههای کافی برای اطمینان از توزیعهای آماری صفحات گنجانده شده داریم. حداقل عدد برای صفحات و منبع یکسان است.
صفحات و منابعی که آستانه محبوبیت را رعایت نمیکنند، در مجموعه دادههای CrUX گنجانده نمیشوند.
مبدا
یک مبدأ (Origin) نشان دهنده کل یک وب سایت است که با یک URL مانند https://www.example.com قابل آدرس دهی است. برای اینکه یک مبدأ در مجموعه داده CrUX گنجانده شود، باید دو الزام را برآورده کند:
شما میتوانید با اجرای یک ممیزی Lighthouse و بررسی نتایج دستهبندی سئو، تأیید کنید که سایت شما قابل کشف است. اگر صفحه ریشه شما با شکست مواجه شود ، صفحه از ایندکس شدن مسدود شود یا ممیزیهای کد وضعیت HTTP صفحه ناموفق باشد ، سایت شما قابل کشف نیست.
اگر یک منبع به عنوان منبع قابل کشف عمومی تعیین شود، تجربیات کاربری واجد شرایط در تمام صفحات آن منبع، صرف نظر از قابلیت کشف تک تک صفحات، در سطح منبع تجمیع میشوند. همه این تجربیات در شرط محبوبیت منبع لحاظ میشوند.
برای اهداف پرس و جو، توجه داشته باشید که تمام ریشهها در مجموعه داده CrUX با حروف کوچک نوشته شدهاند.
صفحه
الزامات مربوط به قرار گرفتن یک صفحه در مجموعه داده CrUX همانند origins است:
شما میتوانید با اجرای ممیزی Lighthouse و بررسی نتایج دستهبندی سئو، از قابل کشف بودن یک صفحه اطمینان حاصل کنید. اگر صفحه شما قابل کشف نباشد، یا ایندکس شدن آن مسدود شده باشد یا ممیزی کد وضعیت HTTP آن ناموفق باشد ، صفحه شما قابل کشف نخواهد بود.
اگر صفحه برای برخی از کاربران به صورت عمومی قابل مشاهده باشد، اما در برخی شرایط وضعیت HTTP ناموفق را برگرداند، آن تجربیات در CrUX لحاظ نخواهند شد.
صفحات معمولاً شناسههای اضافی در URL خود دارند، از جمله پارامترهای رشته پرسوجو مانند ?utm_medium=email و قطعاتی مانند #main . این شناسهها از URL در مجموعه داده CrUX حذف میشوند تا تمام تجربیات کاربری در صفحه با هم تجمیع شوند. این برای صفحاتی مفید است که در غیر این صورت، اگر تغییرات URL پراکنده زیادی برای یک صفحه وجود داشته باشد، به آستانه محبوبیت نمیرسند. توجه داشته باشید که در موارد نادر، این ممکن است به طور غیرمنتظرهای تجربیات صفحات مجزا را با هم گروهبندی کند. به عنوان مثال، اگر پارامترهای ?productID=101 و ?productID=102 نشاندهنده صفحات مختلف باشند.
صفحات در CrUX بر اساس صفحه سطح بالا اندازهگیری میشوند. صفحاتی که به عنوان iframe در نظر گرفته میشوند، به طور جداگانه در CrUX گزارش نمیشوند، اما در معیارهای صفحه سطح بالا نقش دارند. به عنوان مثال، اگر https://www.example.com/page.html https://www.example.com/frame.html را در یک iframe جاسازی کند، page.html در CrUX نمایش داده میشود (منوط به سایر معیارهای واجد شرایط بودن) اما frame.html نمایش داده نمیشود . و اگر frame.html CLS ضعیفی داشته باشد، CLS هنگام اندازهگیری CLS برای page.html لحاظ میشود. CrUX گزارش تجربه کاربری کروم است و ممکن است کاربر حتی از iframe بودن آن آگاه نباشد. بنابراین، تجربه در صفحه سطح بالا - بر اساس نحوه مشاهده کاربر - اندازهگیری میشود.
معماری یک وبسایت ممکن است نحوه نمایش دادههای آن در CrUX را پیچیده کند. به عنوان مثال، برنامههای تک صفحهای (SPA) ممکن است از یک طرح انتقال مسیر مبتنی بر جاوا اسکریپت برای حرکت بین صفحات استفاده کنند، برخلاف پیمایشهای صفحه مبتنی بر لنگر مرسوم. این انتقالها به عنوان نمای صفحه جدید برای کاربر ظاهر میشوند، اما برای Chrome و APIهای پلتفرم اصلی، کل تجربه به نمای اولیه صفحه نسبت داده میشود. این محدودیتی از APIهای پلتفرم وب است که CrUX بر اساس آن ساخته شده است، برای اطلاعات بیشتر به بخش «چگونه معماریهای SPA بر Core Web Vitals تأثیر میگذارند» در web.dev مراجعه کنید.
کاربر
برای اینکه تجربیات یک کاربر در مجموعه دادههای CrUX جمعآوری شود، باید معیارهای زیر را داشته باشد:
- گزارش آمار استفاده را فعال کنید.
- تاریخچه مرورگر آنها را همگامسازی کنید.
- عبارت عبور همگامسازی تنظیم نشده باشد.
- از یک پلتفرم پشتیبانیشده استفاده کنید.
پلتفرمهای پشتیبانیشدهی فعلی عبارتند از:
- نسخههای دسکتاپ کروم شامل سیستمعاملهای ویندوز، macOS، ChromeOS و لینوکس.
- نسخههای اندروید کروم، شامل برنامههای تلفن همراه با استفاده از تبهای سفارشی و WebAPKها .
چند استثنای قابل توجه وجود دارد که دادهای به مجموعه داده CrUX ارائه نمیدهند:
- کروم در iOS.
- برنامههای اندروید با استفاده از WebView
- سایر مرورگرهای Chromium (به عنوان مثال Microsoft Edge ).
کروم دادههایی در مورد نسبت کاربرانی که این معیارها را دارند منتشر نمیکند. میتوانید اطلاعات بیشتری در مورد دادههایی که ما جمعآوری میکنیم در کروم کسب کنید.
صفحات موبایلی پرشتاب (AMP)
صفحات ساخته شده با AMP مانند هر صفحه وب دیگری در مجموعه دادههای CrUX گنجانده میشوند. از زمان انتشار CrUX در ژوئن 2020 ، صفحاتی که با استفاده از حافظه پنهان AMP ارائه میشوند و/یا در AMP Viewer رندر میشوند نیز ثبت شده و به URL صفحه ناشر نسبت داده میشوند.
کیفیت دادهها
دادهها در CrUX تحت پردازش کمی قرار میگیرند تا از دقت آماری، ساختارمندی خوب و سهولت جستجو اطمینان حاصل شود.
فیلتر کردن
مجموعه دادههای CrUX فیلتر میشوند تا از اعتبار آماری دادههای ارائه شده اطمینان حاصل شود. این امر ممکن است کل صفحات یا مبدأها را از نمایش در مجموعه دادهها مستثنی کند.
علاوه بر معیارهای واجد شرایط بودن که برای مبداها و صفحات اعمال میشود، فیلترینگ بیشتری برای بخشهای درون دادهها اعمال میشود:
صفحات مبدا یا صفحاتی که بیش از 20٪ از کل ترافیک آنها به دلیل ترکیبات نامناسب ابعاد حذف شده است، به طور کامل از مجموعه دادهها حذف میشوند.
از آنجا که مجموعه دادههای سطح جهانی شامل تجربیات کاربران از همه کشورها میشود، ترکیبهایی از ابعاد که معیارهای محبوبیت در سطح کشور را برآورده نمیکنند، ممکن است همچنان در سطح جهانی گنجانده شوند، مشروط بر اینکه محبوبیت کافی وجود داشته باشد.
فازینگ
مقدار کمی تصادفی بودن به مجموعه دادهها اعمال میشود تا از مهندسی معکوس دادههای حساس، مانند حجم کل ترافیک، جلوگیری شود. این امر بر دقت آمار کلی تأثیری نمیگذارد.
دقت
بیشتر مقادیر معیار در مجموعه داده CrUX به صورت هیستوگرامهایی از مقادیر و اندازههای دسته نمایش داده میشوند، که در آن مقدار هیستوگرام کسری از تمام بخشهای شامل شده است که مجموع آنها برابر با ۱ میشود. اندازههای دسته اعداد اعشاری بین ۱.۰ و ۰.۰۰۰۱ هستند.
عرضهای دستههای هیستوگرام برای سادهسازی پرسوجو و تجسم دادهها نرمالسازی میشوند . این بدان معناست که دستههای بزرگتر میتوانند به دستههای کوچکتر تقسیم شوند که به طور مساوی چگالی اصلی را به اشتراک میگذارند تا عرض دستهها ثابت بماند.
مجوز
مجموعه دادههای CrUX توسط گوگل تحت مجوز بینالمللی Creative Commons Attribution 4.0 منتشر میشوند.