با نحوه ساختار داده های CrUX در BigQuery آشنا شوید.
مقدمه
دادههای خام پشت گزارش Chrome UX (CrUX) در BigQuery موجود است، پایگاه دادهای که در Google Cloud میزبانی میشود.
CrUX در BigQuery به کاربران این امکان را می دهد که مستقیماً مجموعه داده کامل را از سال 2017 پرس و جو کنند، به عنوان مثال برای تجزیه و تحلیل روندها، مقایسه فناوری های وب و دامنه های معیار.
ساختار داده ها بر اساس انتشار ماهانه و همچنین تعدادی جداول خلاصه برای ارائه دسترسی ساده برای پرس و جو از داده ها است.
داده های BigQuery اساس داشبورد CrUX است که به شما امکان می دهد این داده ها را بدون نوشتن پرس و جوهای SQL تجسم کنید.
دسترسی به مجموعه داده
استفاده از BigQuery به یک حساب Google Cloud و دانش اولیه SQL نیاز دارد. مجموعه داده CrUX در BigQuery برای دسترسی و کاوش تا سقف ردیف رایگان رایگان است که هر ماه تمدید می شود و توسط BigQuery ارائه می شود. علاوه بر این، کاربران جدید Google Cloud ممکن است واجد شرایط دریافت اعتبار ثبتنام برای پوشش هزینههای فراتر از سطح رایگان باشند. توجه داشته باشید که برای پروژه Google Cloud باید کارت اعتباری ارائه شود، ببینید چرا باید کارت اعتباری ارائه کنم؟ .
اگر اولین باری است که از BigQuery استفاده میکنید، مراحل زیر را برای راهاندازی یک پروژه دنبال کنید:
- به سمت ایجاد پروژه در کنسول Google Cloud بروید.
- به پروژه جدید خود نامی مانند «گزارش کاربری Chrome من» بدهید و روی ایجاد کلیک کنید.
- در صورت درخواست، اطلاعات صورتحساب خود را ارائه دهید.
- به مجموعه داده CrUX در BigQuery بروید
اکنون آماده شروع پرس و جو از مجموعه داده هستید.
سازمان پروژه
داده های CrUX در BigQuery در دومین سه شنبه ماه بعد منتشر می شود. هر ماه به عنوان یک جدول جدید تحت chrome-ux-report.all
منتشر می شود. همچنین تعدادی جداول تحقق یافته وجود دارد که آمار خلاصه ای را برای هر ماه ارائه می دهد.
- `گزارش chrome-ux
طرح جدول تفصیلی
جداول خام برای هر کشور و all
مجموعه داده ها بر اساس سال و ماه ارائه شده است.
جداول خام
جداول خام دارای طرح زیر هستند:
-
origin
-
effective_connection_type
-
form_factor
-
first_paint
-
first_contentful_paint
-
largest_contentful_paint
-
dom_content_loaded
-
onload
-
layout_instability
-
cumulative_layout_shift
-
-
interaction_to_next_paint
-
navigation_types
-
navigate
-
navigate_cache
-
reload
-
restore
-
back_forward
-
back_forward_cache
-
prerender
-
-
experimental
-
permission
-
notifications
-
-
time_to_first_byte
-
popularity
-
طرح جدول مادی شده
جداول مادی شده برای دسترسی آسان تر به داده های خلاصه با تعدادی از ابعاد کلیدی ارائه شده است. هیچ هیستوگرام ارائه نشده است، در عوض داده های عملکرد با ارزیابی عملکرد و مقدار صدک 75 به کسری جمع می شوند. مجموعه ای از ردیف های نمونه از جدول metrics_summary
در این مثال نشان داده شده است:
yyyymm | منشاء | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
این نشان میدهد که در مجموعه داده 202204، 90.56٪ از تجربیات کاربر واقعی در https://example.com
معیارهای LCP خوب را برآورده میکنند و مقدار درشت صدک 75 LCP 1600 میلیثانیه است. این مقدار کمی کندتر از ماه های گذشته است.
چهار جدول مادی ارائه شده است:
-
metrics_summary
- معیارهای کلیدی بر اساس ماه و مبدا
-
device_summary
- معیارهای کلیدی بر اساس ماه، مبدا و نوع دستگاه
-
country_summary
- معیارهای کلیدی بر اساس ماه، مبدا، نوع دستگاه و کشور
-
origin_summary
- لیستی از همه مبداهای موجود در مجموعه داده
metrics_summary
جدول metrics_summary
شامل آمار خلاصه برای هر مبدا و هر مجموعه داده ماهانه است:
-
yyyymm
- ماه دوره جمع آوری داده ها
-
origin
- URL مبدا سایت
-
rank
- رتبه بندی محبوبیت درشت (از مارس 2021 )
-
[small|medium|large]_cls
- کسری از ترافیک توسط آستانه های CLS
-
[fast|avg|slow]_<metric>
- کسری از ترافیک بر اساس آستانه عملکرد
-
p75_<metric>
- ارزش صدک 75 معیارهای عملکرد (میلی ثانیه)
-
notification_permission_[accept|deny|ignore|dismiss]
- کسری از رفتارهای مجوز اعلان
-
[desktop|phone|tablet]Density
- کسری از ترافیک بر اساس فاکتور شکل
-
[_4G|_3G|_2G|slow2G|offline]Density
- کسری از ترافیک بر اساس نوع اتصال موثر
-
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- کسری از انواع ناوبری
device_summary
جدول device_summary
شامل آمار انبوه بر اساس ماه، مبدا، کشور و دستگاه است. علاوه بر ستون های metrics_summary
وجود دارد:
-
device
- فاکتور فرم دستگاه
country_summary
جدول country_summary
شامل آمار انبوه بر اساس ماه، مبدا، کشور و دستگاه است. علاوه بر ستون های metrics_summary
وجود دارد:
-
country_code
- کد کشور دو حرفی
-
device
- فاکتور فرم دستگاه
origin_summary
جدول origin_summary
شامل لیستی از تمام مبداها در مجموعه داده CrUX است. ماهانه با آخرین لیست مبدا در مجموعه داده به روز می شود و دارای یک ستون است: origin
.
مجموعه داده تجربی
جداول موجود در مجموعه داده آزمایشی کپی دقیق جداول پیشفرض YYYYMM
هستند، اما از ویژگیهای جدیدتر و پیشرفتهتر BigQuery مانند پارتیشنبندی و خوشهبندی استفاده میکنند که به شما امکان میدهد جستارهای سریعتر، سادهتر و ارزانتر بنویسید.
country
مجموعه داده experimental.country
حاوی دادههای انبوهی از مجموعه دادههای country_CC
با یک ستون yyyymm
اضافی برای تاریخ مجموعه است. این طرح با جداول خام با اضافه کردن ستونهای تاریخ و country_code
یکسان است و امکان مقایسه در سطح کشور در طول زمان را بدون پیوستن به جداول ماهانه میدهد.
global
مجموعه داده experimental.global
حاوی دادههای انباشتهشده از all
مجموعه داده با یک ستون yyyymm
اضافی برای تاریخ مجموعه است. این طرح با جداول خام با اضافه کردن تاریخ یکسان است و امکان مقایسه در طول زمان را بدون پیوستن به جداول ماهانه فراهم می کند.