تعرَّف على كيفية تنظيم بيانات CrUX على BigQuery.
مقدمة
تتوفّر البيانات الأوّلية لتقرير تجربة المستخدم في Chrome (CrUX) على BigQuery، وهي قاعدة بيانات مستضافة على Google Cloud.
ويسمح CrUX على BigQuery للمستخدمين بإجراء طلب بحث مباشر عن مجموعة البيانات الكاملة التي تعود إلى عام 2017، على سبيل المثال، لتحليل المؤشرات ومقارنة تقنيات الويب ونطاقات قياس الأداء.
يتم تنظيم البيانات حسب الإصدار الشهري، بالإضافة إلى عدد من جداول الملخص لتوفير وصول بسيط للاستعلام عن البيانات.
بيانات BigQuery هي أساس لوحة بيانات CrUX، والتي تتيح لك عرض هذه البيانات بدون كتابة استعلامات SQL.
الوصول إلى مجموعة البيانات
يتطلّب استخدام BigQuery توفُّر حساب على Google Cloud ومعرفة أساسية بلغة SQL. يمكن الوصول إلى مجموعة بيانات CrUX في BigQuery مجانًا واستكشاف ما يصل إلى حدود المستوى المجاني، الذي يتم تجديده شهريًا ويقدّمه BigQuery. بالإضافة إلى ذلك، قد يكون مستخدمو Google Cloud الجدد مؤهَّلين للحصول على رصيد اشتراك لتغطية النفقات خارج المستوى المجاني. يجب تقديم بطاقة ائتمان لمشروع Google Cloud. يُرجى الاطّلاع على المقالة لماذا أحتاج إلى تقديم بطاقة ائتمان؟.
إذا كانت هذه هي المرة الأولى التي تستخدم فيها BigQuery، فاتبع هذه الخطوات لإعداد مشروع:
- انتقِل إلى إنشاء مشروع في وحدة تحكُّم Google Cloud.
- أدخِل اسمًا لمشروعك الجديد، مثل "تقرير تجربة المستخدم على Chrome" وانقر على "إنشاء".
- أدخِل معلومات الفوترة إذا طُلب منك ذلك.
- انتقِل إلى مجموعة بيانات CrUX على BigQuery.
أنت الآن جاهز لبدء الاستعلام عن مجموعة البيانات.
تنظيم المشروع
يتم إصدار بيانات تقرير تجربة المستخدم على الويب على BigQuery في يوم الثلاثاء الثاني من الشهر التالي. يتم إصدار كل شهر كجدول جديد ضمن chrome-ux-report.all
. يوجد أيضًا عدد من الجداول الفعلية التي توفر إحصائيات موجزة لكل شهر.
- `chrome-ux-report
مخطط جدول مفصل
يتم توفير الجداول الأولية لكل بلد ومجموعة بيانات all
حسب السنة والشهر.
طاولات غير معدَّلة
تحتوي الجداول الأولية على المخطط التالي:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
مخطط الجدول المجسَّم
يتم توفير الجداول الشاملة لتسهيل الوصول إلى البيانات التلخيصية حسب عدد من السمات الرئيسية. ولا يتم توفير أي مدرجات تكرارية، وبدلاً من ذلك، يتم تجميع بيانات الأداء في كسور حسب تقييم الأداء والقيمة المئوية الخامسة والسبعين. تظهر مجموعة من أمثلة الصفوف من جدول metrics_summary
في هذا المثال:
س س س س | الأصل | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1,600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1,400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
يوضِّح ذلك أنّه في مجموعة البيانات لعام 2024، استوفت 90.56% من تجارب المستخدمين الفعليين على https://example.com
معايير سرعة عرض أكبر محتوى مرئي (LCP)، وأنّ قيمة سرعة عرض أكبر جزء من المحتوى على الصفحة (LCP) التي تبلغ 75% كانت 1,600 ملي ثانية. وهذا أبطأ قليلاً من الأشهر السابقة.
يتم توفير أربعة جداول مجسمة:
metrics_summary
- المقاييس الرئيسية حسب الشهر والأصل
device_summary
- المقاييس الرئيسية حسب الشهر والمصدر ونوع الجهاز
country_summary
- المقاييس الرئيسية حسب الشهر والمصدر ونوع الجهاز والبلد
origin_summary
- قائمة بجميع الأصول المضمّنة في مجموعة البيانات
metrics_summary
يحتوي الجدول "metrics_summary
" على إحصاءات ملخّصة لكل مصدر ولكل مجموعة بيانات شهرية:
yyyymm
- شهر فترة جمع البيانات
origin
- عنوان URL لأصل الموقع الإلكتروني
rank
- ترتيب تقريبي لمدى رواج الأغنية (اعتبارًا من آذار (مارس) 2021)
[small|medium|large]_cls
- جزء من عدد الزيارات حسب حدود CLS
[fast|avg|slow]_<metric>
- جزء من عدد الزيارات حسب حدود الأداء
p75_<metric>
- القيمة المئوية الخامسة والسبعين لمقاييس الأداء (بالمللي ثانية)
notification_permission_[accept|deny|ignore|dismiss]
- جزء من سلوكيات أذونات الإشعارات
[desktop|phone|tablet]Density
- جزء من عدد الزيارات حسب شكل الجهاز
[_4G|_3G|_2G|slow2G|offline]Density
- جزء من عدد الزيارات حسب نوع الاتصال الفعّال
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- جزء من أنواع التنقّل
device_summary
يحتوي جدول "device_summary
" على إحصاءات مجمَّعة حسب الشهر والأصل والبلد والجهاز. بالإضافة إلى أعمدة "metrics_summary
"، تتوفّر ما يلي:
device
- عامل الشكل للجهاز
country_summary
يحتوي جدول "country_summary
" على إحصاءات مجمَّعة حسب الشهر والأصل والبلد والجهاز. بالإضافة إلى أعمدة "metrics_summary
"، تتوفّر ما يلي:
country_code
- رمز بلد من حرفين
device
- عامل الشكل للجهاز
origin_summary
يحتوي الجدول "origin_summary
" على قائمة بجميع الأصول في مجموعة بيانات CrUX. ويتم تحديثه شهريًا بإضافة أحدث قائمة بالمصادر في مجموعة البيانات، ويحتوي على عمود واحد: origin
.
مجموعة البيانات التجريبية
الجداول في مجموعة البيانات التجريبية هي نُسخ مطابقة لجداول YYYYMM
التلقائية، ولكنها تستفيد من ميزات BigQuery الأحدث والأكثر تقدّمًا، مثل التقسيم والتجميع التي تتيح لك كتابة طلبات بحث أسرع وأسهل وأقل تكلفة.
country
تحتوي مجموعة البيانات experimental.country
على بيانات مجمّعة من مجموعات بيانات country_CC
مع عمود yyyymm
إضافي لتاريخ مجموعة البيانات. يُطابق المخطط الجداول الأولية مع إضافة أعمدة التاريخ وcountry_code
، ما يسمح بتنفيذ مقارنة على مستوى البلد خلال طلبات البحث الزمنية بدون الانضمام إلى الجداول الشهرية.
global
تحتوي مجموعة البيانات experimental.global
على بيانات مجمّعة من مجموعة البيانات all
مع عمود yyyymm
إضافي لتاريخ مجموعة البيانات. يتطابق المخطط مع الجداول الأولية مع إضافة التاريخ، ما يسمح بإجراء المقارنة مع طلبات البحث الزمنية بدون الحاجة إلى الانضمام إلى الجداول الشهرية.