این بخش نحوه جمعآوری و سازماندهی دادههای تجربه کاربر توسط CrUX را مستند میکند.
شایستگی
در هسته مجموعه داده CrUX، تجربیات کاربر فردی است که در توزیعهای سطح صفحه و سطح مبدا جمع میشوند. این بخش واجد شرایط بودن کاربر و الزامات مربوط به صفحات و مبدا در مجموعه داده را مستند می کند. همه معیارهای واجد شرایط بودن باید رعایت شوند تا یک تجربه در دادههای سطح صفحه موجود در PageSpeed Insights و CrUX API: کاربر ، مبدا و صفحه گنجانده شود. تجربیاتی که معیارهای کاربر و مبدا را برآورده میکنند اما صفحه نیستند، در دادههای سطح مبدا موجود در همه منابع داده CrUX گنجانده نمیشوند.
اگر در طول زمان واجد شرایط بودن آنها تغییر کند، صفحات و مبدا به طور خودکار شامل یا از مجموعه داده حذف می شوند. در حال حاضر، شما نمی توانید به صورت دستی صفحات یا مبدا را برای گنجاندن ارسال کنید.
قابل کشف عمومی
یک صفحه باید به صورت عمومی قابل کشف باشد تا در مجموعه داده CrUX در نظر گرفته شود.
یک صفحه با استفاده از معیارهای نمایهپذیری مشابه موتورهای جستجو، بهطور عمومی قابل کشف است.
در صورتی که هر یک از شرایط زیر، از جمله صفحات ریشه برای مجموعه داده مبدا، وجود داشته باشد، یک صفحه نمی تواند الزامات قابلیت کشف را برآورده کند:
- صفحه با کد وضعیت HTTP غیر از
200
(پس از تغییر مسیر) ارائه می شود. - صفحه با یک HTTP
X-Robots-Tag: noindex
header یا معادل آن ارائه می شود. - این سند شامل یک متا تگ
<meta name="robots" content="noindex">
یا معادل آن است.
برای مروری بر وضعیت نمایه سازی سایت خود به کنسول جستجوی گوگل مراجعه کنید.
به اندازه کافی محبوب است
در صورتی که یک صفحه دارای حداقل تعداد بازدیدکننده باشد، مشخص می شود که به اندازه کافی محبوب است. در صورتی که یک مبدأ به اندازه کافی محبوب باشد مشخص می شود که در تمام صفحاتش حداقل تعداد بازدیدکننده داشته باشد. عدد دقیقی فاش نشده است، اما برای اطمینان از داشتن نمونه های کافی برای اطمینان از توزیع آماری برای صفحات موجود انتخاب شده است. حداقل تعداد برای صفحات و مبدا یکسان است.
صفحات و مبداهایی که آستانه محبوبیت را برآورده نمی کنند در مجموعه داده CrUX گنجانده نشده اند.
اصل و نسب
مبدا یک وب سایت کامل را نشان می دهد که با آدرس اینترنتی مانند https://www.example.com
قابل آدرس دهی است. برای اینکه یک مبدا در مجموعه داده CrUX گنجانده شود، باید دو شرط را برآورده کند:
با اجرای ممیزی Lighthouse و مشاهده نتایج دسته بندی SEO، می توانید تأیید کنید که منشاء شما قابل کشف است. اگر صفحه اصلی شما با شکست مواجه شود ، صفحه از فهرست بندی مسدود شده باشد یا صفحه دارای ممیزی کد وضعیت HTTP ناموفق باشد، سایت شما قابل شناسایی نیست.
اگر مشخص شود که یک مبدأ برای عموم قابل کشف است، تجربیات کاربر واجد شرایط در همه صفحات آن مبدأ بدون در نظر گرفتن قابلیت شناسایی صفحه جداگانه، در سطح مبدا جمع میشوند. همه این تجربیات به عنوان الزامات محبوبیت اصلی به حساب می آیند.
برای اهداف پرس و جو، توجه داشته باشید که تمام مبدا در مجموعه داده CrUX با حروف کوچک هستند.
صفحه
الزامات یک صفحه برای گنجاندن در مجموعه داده CrUX مانند مبدا است:
با اجرای ممیزی Lighthouse و مشاهده نتایج دسته بندی SEO، می توانید تأیید کنید که یک صفحه قابل کشف است. اگر صفحه شما ناموفق باشد ، صفحه از نمایه سازی مسدود شده باشد یا صفحه دارای ممیزی کد وضعیت HTTP ناموفق باشد، قابل شناسایی نیست.
اگر صفحه برای برخی از کاربران به طور عمومی قابل کشف باشد، اما در برخی شرایط وضعیت HTTP ناموفق را برگرداند، آن تجربیات در CrUX گنجانده نمیشوند.
صفحات معمولاً دارای شناسههای اضافی در URL خود هستند، از جمله پارامترهای رشته کوئری مانند ?utm_medium=email
و قطعاتی مانند #main
. این شناسهها از URL موجود در مجموعه داده CrUX حذف میشوند تا تمام تجربیات کاربر در صفحه با هم جمع شوند. این برای صفحاتی مفید است که در غیر این صورت، در صورتی که تغییرات URL از هم گسسته زیادی برای همان صفحه وجود داشته باشد، آستانه محبوبیت را برآورده نمی کنند. توجه داشته باشید که در موارد نادر این ممکن است به طور غیرمنتظره ای تجربیات را برای صفحات مجزا با هم گروه بندی کند. برای مثال اگر پارامترهای ?productID=101
و ?productID=102
صفحات مختلف را نشان دهند.
صفحات در CrUX بر اساس صفحه سطح بالا اندازه گیری می شوند. صفحاتی که بهعنوان iframe درج میشوند بهطور جداگانه در CrUX گزارش نمیشوند، اما به معیارهای صفحه سطح بالا کمک میکنند. برای مثال، اگر https://www.example.com/page.html
https://www.example.com/frame.html
در یک iframe جاسازی کند، page.html
در CrUX نمایش داده می شود (مطابق با شرایط دیگر معیارها) اما frame.html
نمی کند . و اگر frame.html
دارای CLS ضعیف باشد، CLS هنگام اندازهگیری CLS برای page.html
گنجانده میشود. CrUX گزارش تجربه کاربر Chrome است و کاربر ممکن است حتی از این یک iframe نداند. بنابراین، تجربه در صفحه سطح بالا اندازهگیری میشود - مطابق با نحوه مشاهده کاربر.
معماری یک وب سایت ممکن است نحوه نمایش داده های آن در CrUX را پیچیده کند. برای مثال، برنامههای تک صفحهای (SPA) ممکن است از یک طرح انتقال مسیر مبتنی بر جاوا اسکریپت برای جابهجایی بین صفحات استفاده کنند، برخلاف پیمایشهای صفحه مبتنی بر لنگر معمولی. این انتقالها بهعنوان بازدیدهای صفحه جدید برای کاربر ظاهر میشوند، اما به Chrome و APIهای پلتفرم زیربنایی، کل تجربه به نمای اولیه صفحه نسبت داده میشود. این یک محدودیت برای APIهای پلتفرم وب است که CrUX بر روی آنها ساخته شده است، برای اطلاعات بیشتر ببینید چگونه معماری های SPA بر Core Web Vitals در web.dev تأثیر می گذارد .
کاربر
برای اینکه یک کاربر تجربیات خود را در مجموعه داده CrUX جمع آوری کند، باید معیارهای زیر را داشته باشد:
- فعال کردن گزارش آماری استفاده
- سابقه مرورگر آنها را همگام سازی کنید.
- مجموعه عبارت عبور همگامسازی را ندارید.
- از پلتفرم پشتیبانی شده استفاده کنید.
پلتفرم های فعلی پشتیبانی شده عبارتند از:
- نسخههای رومیزی Chrome از جمله سیستمعاملهای Windows، macOS، ChromeOS و Linux.
- نسخههای Android Chrome، از جمله برنامههای تلفن همراه با استفاده از برگههای سفارشی و WebAPK .
چند استثنا قابل توجه وجود دارد که داده ای را برای مجموعه داده CrUX ارائه نمی دهد:
- کروم در iOS.
- برنامه های اندروید با استفاده از WebView.
- سایر مرورگرهای Chromium (به عنوان مثال Microsoft Edge ).
Chrome دادههایی درباره نسبت کاربرانی که این معیارها را دارند منتشر نمیکند. میتوانید درباره دادههایی که در کاغذ سفید حریم خصوصی Chrome جمعآوری میکنیم بیشتر بیاموزید.
صفحات موبایل تسریع شده (AMP)
صفحات ساخته شده با AMP مانند هر صفحه وب دیگری در مجموعه داده CrUX گنجانده شده است. از زمان انتشار CrUX در ژوئن 2020 ، صفحاتی که با استفاده از حافظه پنهان AMP ارائه میشوند و/یا در AMP Viewer ارائه میشوند نیز ضبط میشوند و به URL صفحه ناشر نسبت داده میشوند.
کیفیت داده
دادهها در CrUX تحت مقدار کمی پردازش قرار میگیرند تا اطمینان حاصل شود که از نظر آماری دقیق، ساختار خوبی دارند و پرسوجو آسانتر هستند.
فیلتر کردن
مجموعه داده CrUX فیلتر می شود تا اطمینان حاصل شود که داده های ارائه شده از نظر آماری معتبر هستند. این ممکن است کل صفحات یا مبدا را از نمایش در مجموعه داده حذف کند.
علاوه بر معیارهای واجد شرایط بودن اعمال شده برای مبدا و صفحات، فیلتر بیشتر برای بخشهای درون داده اعمال میشود:
مبداها یا صفحاتی که بیش از 20٪ از کل ترافیک آنها به دلیل ترکیبات نامناسب ابعاد حذف شده است، به طور کامل از مجموعه داده حذف می شوند.
از آنجایی که مجموعه داده در سطح جهانی تجربیات کاربر از همه کشورها را در بر می گیرد، ترکیبی از ابعادی که معیارهای محبوبیت در سطح کشور را برآورده نمی کنند ممکن است همچنان در سطح جهانی گنجانده شوند، مشروط بر اینکه محبوبیت کافی وجود داشته باشد.
مبهم
مقدار کمی تصادفی به مجموعه داده اعمال می شود تا از مهندسی معکوس داده های حساس مانند حجم کل ترافیک جلوگیری شود. این بر دقت آمار کل تأثیر نمی گذارد.
دقت، درستی
اکثر مقادیر متریک در مجموعه داده CrUX به صورت هیستوگرام مقادیر و اندازههای bin نشان داده میشوند، که در آن مقدار هیستوگرام کسری از تمام بخشهای گنجانده شده است که جمع آن 1 است.
پهنای سطل هیستوگرام برای ساده کردن پرس و جو و تجسم داده ها عادی شده است . این بدان معناست که سطلهای بزرگتر ممکن است به سطلهای کوچکتر تقسیم شوند، که به طور مساوی چگالی اصلی را بهمنظور حفظ عرض سطلهای یکسان تقسیم میکنند.
مجوز
مجموعه دادههای CrUX توسط Google تحت مجوز Creative Commons Attribution 4.0 بینالمللی مجوز دارند.