ดูโครงสร้างข้อมูล CrUX ใน BigQuery
เกริ่นนำ
ข้อมูลดิบที่อยู่เบื้องหลังรายงาน UX ของ Chrome (CrUX) มีอยู่ใน BigQuery ซึ่งเป็นฐานข้อมูลที่โฮสต์บน Google Cloud
CrUX ใน BigQuery ช่วยให้ผู้ใช้ค้นหาชุดข้อมูลฉบับเต็มย้อนไปตั้งแต่ปี 2017 ได้โดยตรง เช่น วิเคราะห์แนวโน้ม เปรียบเทียบเทคโนโลยีเว็บ และโดเมนการเปรียบเทียบ
ข้อมูลจะมีโครงสร้างตามการเผยแพร่รายเดือน พร้อมด้วยตารางสรุปจำนวนหนึ่งเพื่อให้ง่ายต่อการค้นหาข้อมูล
ข้อมูล BigQuery เป็นพื้นฐานของแดชบอร์ด CrUX ซึ่งช่วยให้คุณแสดงภาพข้อมูลนี้ได้โดยไม่ต้องเขียนการค้นหา SQL
เข้าถึงชุดข้อมูล
การใช้ BigQuery จำเป็นต้องมีบัญชี Google Cloud และความรู้พื้นฐานเกี่ยวกับ SQL ชุดข้อมูล CrUX ใน BigQuery เข้าถึงและสำรวจตามขีดจำกัดของรุ่นฟรีได้ฟรี ซึ่งต่ออายุเป็นรายเดือนและให้บริการโดย BigQuery นอกจากนี้ ผู้ใช้ Google Cloud รายใหม่อาจมีสิทธิ์ได้รับเครดิตลงชื่อสมัครใช้เพื่อครอบคลุมค่าใช้จ่ายที่นอกเหนือจากรุ่นฟรี โปรดทราบว่าคุณต้องระบุบัตรเครดิตสําหรับโปรเจ็กต์ Google Cloud โปรดดูหัวข้อทําไมฉันจึงต้องให้ข้อมูลบัตรเครดิต
หากเพิ่งใช้ BigQuery เป็นครั้งแรก ให้ทำตามขั้นตอนต่อไปนี้เพื่อสร้างโปรเจ็กต์
- ไปที่สร้างโปรเจ็กต์ในคอนโซล Google Cloud
- ตั้งชื่อโปรเจ็กต์ใหม่ เช่น "รายงาน UX ของฉันใน Chrome" แล้วคลิก "สร้าง"
- ระบุข้อมูลสำหรับการเรียกเก็บเงินของคุณเมื่อได้รับแจ้ง
- ไปที่ชุดข้อมูล CrUX ใน BigQuery
ตอนนี้คุณพร้อมที่จะเริ่มค้นหาชุดข้อมูลแล้ว
องค์กรโปรเจ็กต์
เราจะเผยแพร่ข้อมูล CrUX ใน BigQuery ในวันอังคารที่ 2 ของเดือนถัดไป ระบบจะเผยแพร่แต่ละเดือนเป็นตารางใหม่ภายใต้ chrome-ux-report.all
นอกจากนี้ยังมีตารางที่เป็นรูปธรรมจำนวนมากที่แสดงสถิติโดยสรุปสำหรับแต่ละเดือน
- chrome-ux-report
สคีมาตารางโดยละเอียด
ตารางดิบสำหรับแต่ละประเทศและชุดข้อมูล all
จะระบุตามปีและเดือน
ตารางดิบ
ตารางดิบมีสคีมาต่อไปนี้
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
สคีมาตารางที่เป็นรูปธรรม
เราจัดเตรียมตารางที่เป็นรูปธรรมขึ้นมาเพื่อให้เข้าถึงข้อมูลสรุปตามมิติข้อมูลคีย์จำนวนหนึ่งได้ง่ายขึ้น ไม่มีการระบุฮิสโตแกรม แต่ข้อมูลประสิทธิภาพจะถูกรวมเป็นเศษส่วนตามการประเมินประสิทธิภาพและค่าเปอร์เซ็นไทล์ที่ 75 ชุดแถวตัวอย่างจากตาราง metrics_summary
จะแสดงในตัวอย่างนี้
ปปปปดด | ต้นกำเนิด | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1,600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1,400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1,500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1,500 |
ข้อมูลนี้แสดงให้เห็นว่าในชุดข้อมูลปี 202204 ประสบการณ์ของผู้ใช้จริง 90.56% ใน https://example.com
ตรงตามเกณฑ์ LCP ที่ดี และค่า LCP เปอร์เซ็นไทล์ที่ 75 แบบคร่าวๆ คือ 1,600 มิลลิวินาที ซึ่งช้ากว่าเดือนที่ผ่านมาเล็กน้อย
มีตารางที่เป็นรูปธรรม 4 ตาราง ได้แก่
metrics_summary
- เมตริกหลักตามเดือนและต้นทาง
device_summary
- เมตริกหลักตามเดือน ต้นทาง และประเภทอุปกรณ์
country_summary
- เมตริกหลักตามเดือน ต้นทาง ประเภทอุปกรณ์ และประเทศ
origin_summary
- รายการต้นทางทั้งหมดที่รวมอยู่ในชุดข้อมูล
metrics_summary
ตาราง metrics_summary
มีสถิติสรุปสำหรับต้นทางแต่ละแห่งและชุดข้อมูลรายเดือนแต่ละชุด ดังนี้
yyyymm
- เดือนของระยะเวลาเก็บรวบรวมข้อมูล
origin
- URL ของต้นทางของเว็บไซต์
rank
- การจัดอันดับความนิยมคร่าวๆ (ข้อมูล ณ วันที่มีนาคม 2021)
[small|medium|large]_cls
- เศษส่วนของการเข้าชมตามเกณฑ์ CLS
[fast|avg|slow]_<metric>
- เศษส่วนของการเข้าชมตามเกณฑ์ประสิทธิภาพ
p75_<metric>
- ค่าเปอร์เซ็นไทล์ที่ 75 ของเมตริกประสิทธิภาพ (มิลลิวินาที)
notification_permission_[accept|deny|ignore|dismiss]
- เศษส่วนของการทำงานของสิทธิ์การแจ้งเตือน
[desktop|phone|tablet]Density
- เศษส่วนการเข้าชมตามรูปแบบของอุปกรณ์
[_4G|_3G|_2G|slow2G|offline]Density
- เศษส่วนการเข้าชมตามประเภทการเชื่อมต่อที่มีประสิทธิภาพ
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- เศษส่วนของประเภทการนำทาง
device_summary
ตาราง device_summary
มีสถิติแบบรวมตามเดือน ต้นทาง ประเทศ และอุปกรณ์ นอกเหนือจากคอลัมน์ metrics_summary
ยังมี:
device
- รูปแบบของอุปกรณ์
country_summary
ตาราง country_summary
มีสถิติแบบรวมตามเดือน ต้นทาง ประเทศ และอุปกรณ์ นอกเหนือจากคอลัมน์ metrics_summary
ยังมี:
country_code
- รหัสประเทศ 2 ตัวอักษร
device
- รูปแบบของอุปกรณ์
origin_summary
ตาราง origin_summary
มีรายการต้นทางทั้งหมดในชุดข้อมูล CrUX โดยมีการอัปเดตทุกเดือนด้วยรายการต้นทางล่าสุดในชุดข้อมูล และมีคอลัมน์เดียวคือ origin
ชุดข้อมูลทดลอง
ตารางในชุดข้อมูลทดลองเป็นสำเนาที่เหมือนกับตาราง YYYYMM
เริ่มต้นทุกประการ แต่จะใช้ฟีเจอร์ BigQuery แบบใหม่และขั้นสูงขึ้น เช่น การแบ่งพาร์ติชันและความคลัสเตอร์ที่ช่วยให้คุณเขียนคำค้นหาได้เร็วขึ้น ง่ายขึ้น และถูกลง
country
ชุดข้อมูล experimental.country
ประกอบด้วยข้อมูลรวมจากชุดข้อมูล country_CC
ที่มีคอลัมน์ yyyymm
เพิ่มเติมสำหรับวันที่ของชุดข้อมูล สคีมาเหมือนกับตารางดิบโดยมีคอลัมน์วันที่และ country_code
เพิ่มเข้ามา ซึ่งช่วยให้ดำเนินการเปรียบเทียบระดับประเทศได้ในช่วงเวลาต่างๆ โดยไม่ต้องนำตารางรายเดือนมารวมเข้าด้วยกัน
global
ชุดข้อมูล experimental.global
มีข้อมูลรวมจากชุดข้อมูล all
ที่มีคอลัมน์ yyyymm
เพิ่มเติมสำหรับวันที่ของชุดข้อมูล สคีมาเหมือนกับตารางข้อมูลดิบโดยเพิ่มวันที่ ซึ่งช่วยให้เปรียบเทียบการค้นหาในช่วงเวลาที่ผ่านมาได้โดยไม่ต้องรวมตารางรายเดือน