متدولوژی CrUX

این بخش نحوه جمع‌آوری و سازماندهی داده‌های تجربه کاربری توسط CrUX را مستند می‌کند.

واجد شرایط بودن

در هسته مجموعه داده‌های CrUX، تجربیات کاربری فردی قرار دارند که در توزیع‌های سطح صفحه و سطح مبدا تجمیع شده‌اند. این بخش، واجد شرایط بودن کاربر و الزامات مربوط به صفحات و مبداها برای گنجاندن در مجموعه داده‌ها را مستند می‌کند. برای اینکه یک تجربه در داده‌های سطح صفحه موجود در PageSpeed ​​Insights و CrUX API شامل شود، باید تمام معیارهای واجد شرایط بودن رعایت شوند: کاربر ، مبدا و صفحه . تجربیاتی که معیارهای کاربر و مبدا را برآورده می‌کنند اما معیارهای صفحه را ندارند، در داده‌های سطح مبدا موجود در تمام منابع داده CrUX گنجانده نمی‌شوند.

صفحات و منابع اصلی در صورت تغییر شرایطشان در طول زمان، به طور خودکار از مجموعه داده‌ها حذف یا اضافه می‌شوند. در حال حاضر، شما نمی‌توانید صفحات یا منابع اصلی را به صورت دستی برای اضافه شدن ارسال کنید.

قابل کشف عمومی

یک صفحه باید به صورت عمومی قابل کشف باشد تا برای گنجاندن در مجموعه داده‌های CrUX در نظر گرفته شود.

یک صفحه با استفاده از همان معیارهای ایندکس‌پذیری موتورهای جستجو، برای عموم قابل کشف تعیین می‌شود.

اگر هر یک از شرایط زیر برآورده شود، یک صفحه نمی‌تواند الزام قابلیت کشف را برآورده کند، از جمله صفحات ریشه برای مجموعه داده‌های مبدا:

  • این صفحه با کد وضعیت HTTP غیر از 200 (پس از ریدایرکت‌ها) ارائه می‌شود.
  • این صفحه با یک هدر HTTP X-Robots-Tag: noindex یا معادل آن ارائه می‌شود.
  • این سند شامل یک متا تگ <meta name="robots" content="noindex"> یا معادل آن است.

برای بررسی کلی وضعیت ایندکس شدن سایت خود، به کنسول جستجوی گوگل مراجعه کنید.

به اندازه کافی محبوب

یک صفحه در صورتی به اندازه کافی محبوب است که حداقل تعداد بازدیدکننده داشته باشد. یک منبع در صورتی به اندازه کافی محبوب است که حداقل تعداد بازدیدکننده در تمام صفحات خود داشته باشد. عدد دقیقی فاش نشده است، اما این عدد انتخاب شده است تا اطمینان حاصل شود که نمونه‌های کافی برای اطمینان از توزیع‌های آماری صفحات گنجانده شده داریم. حداقل عدد برای صفحات و منبع یکسان است.

صفحات و منابعی که آستانه محبوبیت را رعایت نمی‌کنند، در مجموعه داده‌های CrUX گنجانده نمی‌شوند.

مبدا

یک مبدأ (Origin) نشان دهنده کل یک وب سایت است که با یک URL مانند https://www.example.com قابل آدرس دهی است. برای اینکه یک مبدأ در مجموعه داده CrUX گنجانده شود، باید دو الزام را برآورده کند:

  1. قابل کشف عمومی
  2. به اندازه کافی محبوب

شما می‌توانید با اجرای یک ممیزی Lighthouse و بررسی نتایج دسته‌بندی سئو، تأیید کنید که سایت شما قابل کشف است. اگر صفحه ریشه شما با شکست مواجه شود ، صفحه از ایندکس شدن مسدود شود یا ممیزی‌های کد وضعیت HTTP صفحه ناموفق باشد ، سایت شما قابل کشف نیست.

اگر یک منبع به عنوان منبع قابل کشف عمومی تعیین شود، تجربیات کاربری واجد شرایط در تمام صفحات آن منبع، صرف نظر از قابلیت کشف تک تک صفحات، در سطح منبع تجمیع می‌شوند. همه این تجربیات در شرط محبوبیت منبع لحاظ می‌شوند.

برای اهداف پرس و جو، توجه داشته باشید که تمام ریشه‌ها در مجموعه داده CrUX با حروف کوچک نوشته شده‌اند.

صفحه

الزامات مربوط به قرار گرفتن یک صفحه در مجموعه داده CrUX همانند origins است:

  1. قابل کشف عمومی
  2. به اندازه کافی محبوب

شما می‌توانید با اجرای ممیزی Lighthouse و بررسی نتایج دسته‌بندی سئو، از قابل کشف بودن یک صفحه اطمینان حاصل کنید. اگر صفحه شما قابل کشف نباشد، یا ایندکس شدن آن مسدود شده باشد یا ممیزی کد وضعیت HTTP آن ناموفق باشد ، صفحه شما قابل کشف نخواهد بود.

اگر صفحه برای برخی از کاربران به صورت عمومی قابل مشاهده باشد، اما در برخی شرایط وضعیت HTTP ناموفق را برگرداند، آن تجربیات در CrUX لحاظ نخواهند شد.

صفحات معمولاً شناسه‌های اضافی در URL خود دارند، از جمله پارامترهای رشته پرس‌وجو مانند ?utm_medium=email و قطعاتی مانند #main . این شناسه‌ها از URL در مجموعه داده CrUX حذف می‌شوند تا تمام تجربیات کاربری در صفحه با هم تجمیع شوند. این برای صفحاتی مفید است که در غیر این صورت، اگر تغییرات URL پراکنده زیادی برای یک صفحه وجود داشته باشد، به آستانه محبوبیت نمی‌رسند. توجه داشته باشید که در موارد نادر، این ممکن است به طور غیرمنتظره‌ای تجربیات صفحات مجزا را با هم گروه‌بندی کند. به عنوان مثال، اگر پارامترهای ?productID=101 و ?productID=102 نشان‌دهنده صفحات مختلف باشند.

صفحات در CrUX بر اساس صفحه سطح بالا اندازه‌گیری می‌شوند. صفحاتی که به عنوان iframe در نظر گرفته می‌شوند، به طور جداگانه در CrUX گزارش نمی‌شوند، اما در معیارهای صفحه سطح بالا نقش دارند. به عنوان مثال، اگر https://www.example.com/page.html https://www.example.com/frame.html را در یک iframe جاسازی کند، page.html در CrUX نمایش داده می‌شود (منوط به سایر معیارهای واجد شرایط بودن) اما frame.html نمایش داده نمی‌شود . و اگر frame.html CLS ضعیفی داشته باشد، CLS هنگام اندازه‌گیری CLS برای page.html لحاظ می‌شود. CrUX گزارش تجربه کاربری کروم است و ممکن است کاربر حتی از iframe بودن آن آگاه نباشد. بنابراین، تجربه در صفحه سطح بالا - بر اساس نحوه مشاهده کاربر - اندازه‌گیری می‌شود.

معماری یک وب‌سایت ممکن است نحوه نمایش داده‌های آن در CrUX را پیچیده کند. به عنوان مثال، برنامه‌های تک صفحه‌ای (SPA) ممکن است از یک طرح انتقال مسیر مبتنی بر جاوا اسکریپت برای حرکت بین صفحات استفاده کنند، برخلاف پیمایش‌های صفحه مبتنی بر لنگر مرسوم. این انتقال‌ها به عنوان نمای صفحه جدید برای کاربر ظاهر می‌شوند، اما برای Chrome و APIهای پلتفرم اصلی، کل تجربه به نمای اولیه صفحه نسبت داده می‌شود. این محدودیتی از APIهای پلتفرم وب است که CrUX بر اساس آن ساخته شده است، برای اطلاعات بیشتر به بخش «چگونه معماری‌های SPA بر Core Web Vitals تأثیر می‌گذارند» در web.dev مراجعه کنید.

کاربر

برای اینکه تجربیات یک کاربر در مجموعه داده‌های CrUX جمع‌آوری شود، باید معیارهای زیر را داشته باشد:

  1. گزارش آمار استفاده را فعال کنید.
  2. تاریخچه مرورگر آنها را همگام‌سازی کنید.
  3. عبارت عبور همگام‌سازی تنظیم نشده باشد.
  4. از یک پلتفرم پشتیبانی‌شده استفاده کنید.

پلتفرم‌های پشتیبانی‌شده‌ی فعلی عبارتند از:

  • نسخه‌های دسکتاپ کروم شامل سیستم‌عامل‌های ویندوز، macOS، ChromeOS و لینوکس.
  • نسخه‌های اندروید کروم، شامل برنامه‌های تلفن همراه با استفاده از تب‌های سفارشی و WebAPKها .

چند استثنای قابل توجه وجود دارد که داده‌ای به مجموعه داده CrUX ارائه نمی‌دهند:

  • کروم در iOS.
  • برنامه‌های اندروید با استفاده از WebView
  • سایر مرورگرهای Chromium (به عنوان مثال Microsoft Edge ).

کروم داده‌هایی در مورد نسبت کاربرانی که این معیارها را دارند منتشر نمی‌کند. می‌توانید اطلاعات بیشتری در مورد داده‌هایی که ما جمع‌آوری می‌کنیم در کروم کسب کنید.

صفحات موبایلی پرشتاب (AMP)

صفحات ساخته شده با AMP مانند هر صفحه وب دیگری در مجموعه داده‌های CrUX گنجانده می‌شوند. از زمان انتشار CrUX در ژوئن 2020 ، صفحاتی که با استفاده از حافظه پنهان AMP ارائه می‌شوند و/یا در AMP Viewer رندر می‌شوند نیز ثبت شده و به URL صفحه ناشر نسبت داده می‌شوند.

کیفیت داده‌ها

داده‌ها در CrUX تحت پردازش کمی قرار می‌گیرند تا از دقت آماری، ساختارمندی خوب و سهولت جستجو اطمینان حاصل شود.

فیلتر کردن

مجموعه داده‌های CrUX فیلتر می‌شوند تا از اعتبار آماری داده‌های ارائه شده اطمینان حاصل شود. این امر ممکن است کل صفحات یا مبدأها را از نمایش در مجموعه داده‌ها مستثنی کند.

علاوه بر معیارهای واجد شرایط بودن که برای مبداها و صفحات اعمال می‌شود، فیلترینگ بیشتری برای بخش‌های درون داده‌ها اعمال می‌شود:

صفحات مبدا یا صفحاتی که بیش از 20٪ از کل ترافیک آنها به دلیل ترکیبات نامناسب ابعاد حذف شده است، به طور کامل از مجموعه داده‌ها حذف می‌شوند.

از آنجا که مجموعه داده‌های سطح جهانی شامل تجربیات کاربران از همه کشورها می‌شود، ترکیب‌هایی از ابعاد که معیارهای محبوبیت در سطح کشور را برآورده نمی‌کنند، ممکن است همچنان در سطح جهانی گنجانده شوند، مشروط بر اینکه محبوبیت کافی وجود داشته باشد.

فازینگ

مقدار کمی تصادفی بودن به مجموعه داده‌ها اعمال می‌شود تا از مهندسی معکوس داده‌های حساس، مانند حجم کل ترافیک، جلوگیری شود. این امر بر دقت آمار کلی تأثیری نمی‌گذارد.

دقت

بیشتر مقادیر معیار در مجموعه داده CrUX به صورت هیستوگرام‌هایی از مقادیر و اندازه‌های دسته نمایش داده می‌شوند، که در آن مقدار هیستوگرام کسری از تمام بخش‌های شامل شده است که مجموع آنها برابر با ۱ می‌شود. اندازه‌های دسته اعداد اعشاری بین ۱.۰ و ۰.۰۰۰۱ هستند.

عرض‌های دسته‌های هیستوگرام برای ساده‌سازی پرس‌وجو و تجسم داده‌ها نرمال‌سازی می‌شوند . این بدان معناست که دسته‌های بزرگتر می‌توانند به دسته‌های کوچکتر تقسیم شوند که به طور مساوی چگالی اصلی را به اشتراک می‌گذارند تا عرض دسته‌ها ثابت بماند.

مجوز

مجموعه داده‌های CrUX توسط گوگل تحت مجوز بین‌المللی Creative Commons Attribution 4.0 منتشر می‌شوند.