متدولوژی CrUX

این بخش نحوه جمع‌آوری و سازماندهی داده‌های تجربه کاربر توسط CrUX را مستند می‌کند.

شایستگی

در هسته مجموعه داده CrUX، تجربیات کاربر فردی است که در توزیع‌های سطح صفحه و سطح مبدا جمع می‌شوند. این بخش واجد شرایط بودن کاربر و الزامات مربوط به صفحات و مبدا در مجموعه داده را مستند می کند. همه معیارهای واجد شرایط بودن باید رعایت شوند تا یک تجربه در داده‌های سطح صفحه موجود در PageSpeed ​​Insights و CrUX API: کاربر ، مبدا و صفحه گنجانده شود. تجربیاتی که معیارهای کاربر و مبدا را برآورده می‌کنند اما صفحه نیستند، در داده‌های سطح مبدا موجود در همه منابع داده CrUX گنجانده نمی‌شوند.

اگر در طول زمان واجد شرایط بودن آنها تغییر کند، صفحات و مبدا به طور خودکار شامل یا از مجموعه داده حذف می شوند. در حال حاضر، شما نمی توانید به صورت دستی صفحات یا مبدا را برای گنجاندن ارسال کنید.

قابل کشف عمومی

یک صفحه باید به صورت عمومی قابل کشف باشد تا در مجموعه داده CrUX در نظر گرفته شود.

یک صفحه با استفاده از معیارهای نمایه‌پذیری مشابه موتورهای جستجو، به‌طور عمومی قابل کشف است.

در صورتی که هر یک از شرایط زیر، از جمله صفحات ریشه برای مجموعه داده مبدا، وجود داشته باشد، یک صفحه نمی تواند الزامات قابلیت کشف را برآورده کند:

  • صفحه با کد وضعیت HTTP غیر از 200 (پس از تغییر مسیر) ارائه می شود.
  • صفحه با یک HTTP X-Robots-Tag: noindex header یا معادل آن ارائه می شود.
  • این سند شامل یک متا تگ <meta name="robots" content="noindex"> یا معادل آن است.

برای مروری بر وضعیت نمایه سازی سایت خود به کنسول جستجوی گوگل مراجعه کنید.

به اندازه کافی محبوب است

در صورتی که یک صفحه دارای حداقل تعداد بازدیدکننده باشد، مشخص می شود که به اندازه کافی محبوب است. در صورتی که یک مبدأ به اندازه کافی محبوب باشد مشخص می شود که در تمام صفحاتش حداقل تعداد بازدیدکننده داشته باشد. عدد دقیقی فاش نشده است، اما برای اطمینان از داشتن نمونه های کافی برای اطمینان از توزیع آماری برای صفحات موجود انتخاب شده است. حداقل تعداد برای صفحات و مبدا یکسان است.

صفحات و مبداهایی که آستانه محبوبیت را برآورده نمی کنند در مجموعه داده CrUX گنجانده نشده اند.

اصل و نسب

مبدا یک وب سایت کامل را نشان می دهد که با آدرس اینترنتی مانند https://www.example.com قابل آدرس دهی است. برای اینکه یک مبدا در مجموعه داده CrUX گنجانده شود، باید دو شرط را برآورده کند:

  1. قابل کشف عمومی
  2. به اندازه کافی محبوب است

با اجرای ممیزی Lighthouse و مشاهده نتایج دسته بندی SEO، می توانید تأیید کنید که منشاء شما قابل کشف است. اگر صفحه اصلی شما با شکست مواجه شود ، صفحه از فهرست بندی مسدود شده باشد یا صفحه دارای ممیزی کد وضعیت HTTP ناموفق باشد، سایت شما قابل شناسایی نیست.

اگر مشخص شود که یک مبدأ برای عموم قابل کشف است، تجربیات کاربر واجد شرایط در همه صفحات آن مبدأ بدون در نظر گرفتن قابلیت شناسایی صفحه جداگانه، در سطح مبدا جمع می‌شوند. همه این تجربیات به عنوان الزامات محبوبیت اصلی به حساب می آیند.

برای اهداف پرس و جو، توجه داشته باشید که تمام مبدا در مجموعه داده CrUX با حروف کوچک هستند.

صفحه

الزامات یک صفحه برای گنجاندن در مجموعه داده CrUX مانند مبدا است:

  1. قابل کشف عمومی
  2. به اندازه کافی محبوب است

با اجرای ممیزی Lighthouse و مشاهده نتایج دسته بندی SEO، می توانید تأیید کنید که یک صفحه قابل کشف است. اگر صفحه شما ناموفق باشد، صفحه از نمایه سازی مسدود شده باشد یا صفحه دارای ممیزی کد وضعیت HTTP ناموفق باشد، قابل شناسایی نیست.

صفحات معمولاً دارای شناسه‌های اضافی در URL خود هستند، از جمله پارامترهای رشته کوئری مانند ?utm_medium=email و قطعاتی مانند #main . این شناسه‌ها از URL موجود در مجموعه داده CrUX حذف می‌شوند تا تمام تجربیات کاربر در صفحه با هم جمع شوند. این برای صفحاتی مفید است که در غیر این صورت، در صورتی که تغییرات URL از هم گسسته زیادی برای همان صفحه وجود داشته باشد، آستانه محبوبیت را برآورده نمی کنند. توجه داشته باشید که در موارد نادر این ممکن است به طور غیرمنتظره ای تجربیات را برای صفحات مجزا با هم گروه بندی کند. برای مثال اگر پارامترهای ?productID=101 و ?productID=102 صفحات مختلف را نشان دهند.

صفحات در CrUX بر اساس صفحه سطح بالا اندازه گیری می شوند. صفحاتی که به‌عنوان iframe درج می‌شوند به‌طور جداگانه در CrUX گزارش نمی‌شوند، اما به معیارهای صفحه سطح بالا کمک می‌کنند. برای مثال، اگر https://www.example.com/page.html https://www.example.com/frame.html در یک iframe جاسازی کند، page.html در CrUX نمایش داده می شود (مطابق با شرایط دیگر معیارها) اما frame.html نمی کند . و اگر frame.html دارای CLS ضعیف باشد، CLS هنگام اندازه‌گیری CLS برای page.html گنجانده می‌شود. CrUX گزارش تجربه کاربر Chrome است و کاربر ممکن است حتی از این یک iframe نداند. بنابراین، تجربه در صفحه سطح بالا اندازه‌گیری می‌شود - مطابق با نحوه مشاهده کاربر.

معماری یک وب سایت ممکن است نحوه نمایش داده های آن در CrUX را پیچیده کند. برای مثال، برنامه‌های تک صفحه‌ای (SPA) ممکن است از یک طرح انتقال مسیر مبتنی بر جاوا اسکریپت برای جابه‌جایی بین صفحات استفاده کنند، برخلاف پیمایش‌های سنتی صفحه مبتنی بر لنگر. این انتقال‌ها به‌عنوان بازدیدهای صفحه جدید برای کاربر ظاهر می‌شوند، اما به Chrome و APIهای پلتفرم زیربنایی، کل تجربه به نمای اولیه صفحه نسبت داده می‌شود. این یک محدودیت APIهای پلتفرم وب بومی است که CrUX بر روی آنها ساخته شده است، برای اطلاعات بیشتر ببینید چگونه معماری های SPA بر Core Web Vitals در web.dev تأثیر می گذارد .

کاربر

برای اینکه یک کاربر تجربیات خود را در مجموعه داده CrUX جمع آوری کند، باید معیارهای زیر را داشته باشد:

  1. فعال کردن گزارش آماری استفاده
  2. تاریخچه مرورگر آنها را همگام سازی کنید.
  3. مجموعه عبارت عبور همگام‌سازی را ندارید.
  4. از پلتفرم پشتیبانی شده استفاده کنید.

پلتفرم های فعلی پشتیبانی شده عبارتند از:

  • نسخه‌های رومیزی Chrome از جمله سیستم‌عامل‌های Windows، MacOS، ChromeOS و Linux.
  • نسخه‌های Android Chrome، از جمله برنامه‌های بومی با استفاده از برگه‌های سفارشی و WebAPK .

چند استثنا قابل توجه وجود دارد که داده ای را برای مجموعه داده CrUX ارائه نمی دهد:

  • کروم در iOS.
  • برنامه های اندروید بومی با استفاده از WebView.
  • سایر مرورگرهای Chromium (به عنوان مثال Microsoft Edge ).

Chrome داده‌هایی درباره نسبت کاربرانی که این معیارها را دارند منتشر نمی‌کند. می‌توانید درباره داده‌هایی که در کاغذ سفید حریم خصوصی Chrome جمع‌آوری می‌کنیم بیشتر بیاموزید.

صفحات موبایل تسریع شده (AMP)

صفحات ساخته شده با AMP مانند هر صفحه وب دیگری در مجموعه داده CrUX گنجانده شده است. از زمان انتشار CrUX در ژوئن 2020 ، صفحاتی که از طریق حافظه پنهان AMP ارائه می‌شوند و/یا در AMP Viewer ارائه می‌شوند نیز ضبط می‌شوند و به URL صفحه ناشر نسبت داده می‌شوند.

کیفیت داده

داده‌ها در CrUX تحت مقدار کمی پردازش قرار می‌گیرند تا اطمینان حاصل شود که از نظر آماری دقیق، ساختار خوبی دارند و به راحتی قابل جستجو هستند.

فیلتر کردن

مجموعه داده CrUX فیلتر می شود تا اطمینان حاصل شود که داده های ارائه شده از نظر آماری معتبر هستند. این ممکن است کل صفحات یا مبدا را از نمایش در مجموعه داده حذف کند.

علاوه بر معیارهای واجد شرایط بودن اعمال شده برای مبدا و صفحات، فیلتر بیشتر برای بخش‌های درون داده اعمال می‌شود:

مبداها یا صفحاتی که بیش از 20٪ از کل ترافیک آنها به دلیل ترکیبات نامناسب ابعاد حذف شده است، به طور کامل از مجموعه داده حذف می شوند.

از آنجایی که مجموعه داده در سطح جهانی تجربیات کاربر از همه کشورها را در بر می گیرد، ترکیبی از ابعادی که معیارهای محبوبیت در سطح کشور را برآورده نمی کنند، ممکن است همچنان در سطح جهانی گنجانده شوند، مشروط بر اینکه محبوبیت کافی وجود داشته باشد.

مبهم

مقدار کمی تصادفی به مجموعه داده اعمال می شود تا از مهندسی معکوس داده های حساس مانند حجم کل ترافیک جلوگیری شود. این بر دقت آمار کل تأثیر نمی گذارد.

دقت، درستی

اکثر مقادیر متریک در مجموعه داده CrUX به صورت هیستوگرام مقادیر و اندازه‌های bin نشان داده می‌شوند، که در آن مقدار هیستوگرام کسری از تمام بخش‌های گنجانده شده است که جمع آن 1 است.

پهنای سطل هیستوگرام برای ساده کردن پرس و جو و تجسم داده ها عادی شده است . این بدان معناست که سطل‌های بزرگ‌تر ممکن است به سطل‌های کوچک‌تر تقسیم شوند، که به طور مساوی چگالی اصلی را به‌منظور حفظ عرض سطل‌های یکسان تقسیم می‌کنند.

مجوز

مجموعه داده‌های CrUX توسط Google تحت مجوز Creative Commons Attribution 4.0 بین‌المللی مجوز دارند.