วิธีการ CrUX

ส่วนนี้บันทึกวิธีที่ CrUX รวบรวมและจัดระเบียบข้อมูลประสบการณ์ของผู้ใช้

การมีสิทธิ์

หัวใจสำคัญของชุดข้อมูล CrUX คือประสบการณ์ผู้ใช้แต่ละราย ซึ่งรวบรวมไว้ในการกระจายระดับหน้าเว็บและต้นทาง ส่วนนี้จะแสดงการมีสิทธิ์ของผู้ใช้และข้อกำหนดสำหรับหน้าเว็บและต้นทางที่จะรวมไว้ในชุดข้อมูล คุณต้องมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ทั้งหมดเพื่อให้ระบบรวมประสบการณ์ไว้ในข้อมูลระดับหน้าเว็บที่มีอยู่ใน PageSpeed Insights และ CrUX API ซึ่งได้แก่ ผู้ใช้ ต้นทาง และหน้าเว็บ ประสบการณ์ที่ตรงตามเกณฑ์ผู้ใช้และต้นทาง แต่ไม่รวมหน้าเว็บจะไม่รวมอยู่ในข้อมูลระดับต้นทางที่มีอยู่ในแหล่งข้อมูล CrUX ทั้งหมด

ระบบจะรวมหรือนำหน้าเว็บและต้นทางออกจากชุดข้อมูลโดยอัตโนมัติ หากมีการเปลี่ยนแปลงการมีสิทธิ์เมื่อเวลาผ่านไป ปัจจุบันคุณยังส่งหน้าเว็บหรือต้นทางเพื่อให้รวมด้วยตนเองไม่ได้

ค้นพบได้แบบสาธารณะ

หน้าเว็บต้องค้นพบได้แบบสาธารณะจึงจะได้รับการพิจารณาให้รวมไว้ในชุดข้อมูล CrUX

เราพิจารณาแล้วว่าหน้าเว็บจะค้นพบได้แบบสาธารณะโดยใช้เกณฑ์ความสามารถในการจัดทำดัชนีเดียวกันกับเครื่องมือค้นหา

หน้าเว็บไม่สามารถเป็นไปตามข้อกำหนดการค้นพบได้ หากเป็นไปตามเงื่อนไขใดๆ ต่อไปนี้ ซึ่งรวมถึงหน้ารูทสำหรับชุดข้อมูลต้นทาง

  • หน้าเว็บแสดงด้วยรหัสสถานะ HTTP ที่ไม่ใช่ 200 (หลังการเปลี่ยนเส้นทาง)
  • หน้าเว็บแสดงด้วยส่วนหัว HTTP X-Robots-Tag: noindex หรือเทียบเท่า
  • เอกสารมี<meta name="robots" content="noindex"> เมตาแท็กหรือเทียบเท่า

ไปที่ Google Search Console เพื่อดูภาพรวมสถานะการจัดทำดัชนีของเว็บไซต์

ได้รับความนิยมมากพอ

เราจะพิจารณาว่าหน้าเว็บได้รับความนิยมมากพอหากมีจำนวนผู้เข้าชมขั้นต่ำ เราจะถือว่าต้นทางได้รับความนิยมมากพอหากมีจำนวนผู้เข้าชมหน้าเว็บขั้นต่ำตามจำนวนขั้นต่ำ ตัวเลขที่แน่นอนไม่มีการเปิดเผย แต่เลือกมาเพื่อให้แน่ใจว่าเรามีตัวอย่างมากพอที่จะมั่นใจในการกระจายทางสถิติของหน้าเว็บที่รวมอยู่ จำนวนขั้นต่ำสำหรับหน้าเว็บและต้นทางจะเท่ากัน

หน้าและต้นทางที่ไม่เป็นไปตามเกณฑ์ความนิยมจะไม่รวมอยู่ในชุดข้อมูล CrUX

Origin

ต้นทางแสดงถึงทั้งเว็บไซต์ ซึ่งจัดการได้ด้วย URL เช่น https://www.example.com หากต้องการให้รวมต้นทางในชุดข้อมูล CrUX ต้นทางต้องเป็นไปตามข้อกำหนด 2 ข้อดังนี้

  1. ค้นพบได้แบบสาธารณะ
  2. ได้รับความนิยมมากพอ

คุณตรวจสอบได้ว่าต้นทางค้นพบได้โดยเรียกใช้การตรวจสอบ Lighthouse และดูที่ผลการค้นหาหมวดหมู่ SEO เว็บไซต์ของคุณจะค้นหาไม่พบหากรูทของคุณไม่ผ่านการตรวจสอบหน้าเว็บถูกบล็อกไม่ให้จัดทำดัชนีหรือหน้าเว็บมีรหัสสถานะ HTTP ที่ไม่สำเร็จ

หากมีการพิจารณาว่าต้นทางค้นพบได้แบบสาธารณะ ประสบการณ์ของผู้ใช้ที่มีสิทธิ์ในหน้าทั้งหมดของต้นทางนั้นจะรวมอยู่ที่ระดับต้นทาง ไม่ว่าจะค้นพบหน้าเว็บแต่ละหน้าได้หรือไม่ ประสบการณ์ทั้งหมดเหล่านี้ จะนับตามข้อกำหนดความนิยมของต้นทาง

โปรดทราบว่าต้นทางทั้งหมดในชุดข้อมูล CrUX เป็นตัวพิมพ์เล็ก เพื่อวัตถุประสงค์ในการค้นหา

หน้าเว็บ

ข้อกำหนดสำหรับหน้าเว็บที่จะรวมอยู่ในชุดข้อมูล CrUX เหมือนกับต้นทางดังนี้

  1. ค้นพบได้แบบสาธารณะ
  2. ได้รับความนิยมมากพอ

คุณตรวจสอบได้ว่าหน้าเว็บค้นพบได้โดยเรียกใช้การตรวจสอบ Lighthouse และดูผลการค้นหาหมวดหมู่ SEO หน้าเว็บจะไม่แสดงหากหน้าเว็บไม่ผ่านการตรวจสอบหน้าเว็บถูกบล็อกไม่ให้จัดทำดัชนีหรือหน้าเว็บมีรหัสสถานะ HTTP ไม่สำเร็จ

หน้าเว็บมักจะมีตัวระบุเพิ่มเติมใน URL ซึ่งรวมถึงพารามิเตอร์ของสตริงการค้นหา เช่น ?utm_medium=email และส่วนย่อย เช่น #main ตัวระบุเหล่านี้จะถูกตัดออกจาก URL ในชุดข้อมูล CrUX เพื่อให้ผู้ใช้ได้รับประสบการณ์การใช้งานทั้งหมดในหน้าเว็บรวมกัน ซึ่งจะเป็นประโยชน์สำหรับหน้าเว็บที่อาจไม่เป็นไปตามเกณฑ์ความนิยม หากหน้าเว็บมี URL หลายรูปแบบที่ไม่ต่อเนื่องกัน โปรดทราบว่าในบางกรณีที่เกิดขึ้นไม่บ่อยนัก ปัญหานี้อาจจัดกลุ่มประสบการณ์สำหรับหน้าเว็บที่ต่างกันไว้ด้วยกันอย่างไม่คาดคิด เช่น หากพารามิเตอร์ ?productID=101 และ ?productID=102 แสดงถึงหน้าเว็บที่ต่างกัน

ระบบจะวัดหน้าใน CrUX โดยอิงตามหน้าระดับบนสุด หน้าที่รวมเป็น iframe จะไม่รายงานแยกกันใน CrUX แต่ส่งผลต่อเมตริกของหน้าระดับบนสุด ตัวอย่างเช่น หาก https://www.example.com/page.html ฝัง https://www.example.com/frame.html ใน iframe ฟังก์ชัน page.html จะถูกแสดงใน CrUX (ขึ้นอยู่กับเกณฑ์การมีสิทธิ์อื่นๆ) แต่ frame.html จะไม่ และหาก frame.html มี CLS ต่ำ ระบบจะรวม CLS เมื่อวัด CLS สําหรับ page.html CrUX คือรายงานประสบการณ์ของผู้ใช้ Chrome ซึ่งผู้ใช้อาจไม่ทราบว่านี่คือ iframe ดังนั้น ระบบจะวัดประสบการณ์ที่หน้าเว็บระดับบนสุดตามวิธีที่ผู้ใช้เห็น

สถาปัตยกรรมของเว็บไซต์อาจทำให้การแสดงข้อมูลของเว็บไซต์ใน CrUX มีความซับซ้อนมากขึ้น เช่น แอปหน้าเว็บเดียว (SPA) อาจใช้รูปแบบการเปลี่ยนเส้นทางที่ใช้ JavaScript เพื่อย้ายไปมาระหว่างหน้าเว็บ ไม่ใช่การนำทางหน้าเว็บแบบ Anchor แบบเดิม การเปลี่ยนเหล่านี้จะปรากฏเป็นการดูหน้าเว็บแบบใหม่สำหรับผู้ใช้ แต่สำหรับ Chrome และ API ของแพลตฟอร์มที่ใช้งานอยู่ ประสบการณ์ทั้งหมดจะมาจากการดูหน้าเว็บครั้งแรก นี่เป็นข้อจำกัดของ API แพลตฟอร์มเว็บแบบเนทีฟในการสร้าง CrUX โปรดดูข้อมูลเพิ่มเติมที่หัวข้อสถาปัตยกรรม SPA ส่งผลต่อ Core Web Vitals ใน web.dev อย่างไร

ผู้ใช้

ผู้ใช้ต้องมีคุณสมบัติตรงตามเกณฑ์ต่อไปนี้เพื่อให้ผู้ใช้รวบรวมประสบการณ์ไว้ในชุดข้อมูล CrUX

  1. เปิดใช้การรายงานสถิติการใช้งาน
  2. ซิงค์ประวัติการเข้าชมในเบราว์เซอร์
  3. ไม่ได้ตั้งค่ารหัสผ่านการซิงค์
  4. ใช้แพลตฟอร์มที่รองรับ

แพลตฟอร์มที่รองรับในปัจจุบัน ได้แก่

  • Chrome เวอร์ชันเดสก์ท็อป ซึ่งรวมถึงระบบปฏิบัติการ Windows, MacOS, ChromeOS และ Linux
  • Chrome เวอร์ชัน Android ซึ่งรวมถึงแอปที่มาพร้อมเครื่องที่ใช้แท็บที่กำหนดเองและ WebAPKs

มีข้อยกเว้นที่สำคัญบางประการซึ่งไม่ได้ให้ข้อมูลแก่ชุดข้อมูล CrUX ดังนี้

  • Chrome ใน iOS
  • แอป Android ที่มาพร้อมเครื่องโดยใช้ WebView
  • เบราว์เซอร์ Chromium อื่นๆ (เช่น Microsoft Edge)

Chrome จะไม่เผยแพร่ข้อมูลเกี่ยวกับสัดส่วนของผู้ใช้ที่ตรงตามเกณฑ์เหล่านี้ คุณสามารถดูข้อมูลเพิ่มเติมเกี่ยวกับข้อมูลที่เรารวบรวมได้ในสมุดปกขาวเรื่องความเป็นส่วนตัวของ Chrome

Accelerated Mobile Pages (AMP)

หน้าที่สร้างด้วย AMP จะรวมอยู่ในชุดข้อมูล CrUX เช่นเดียวกับหน้าเว็บอื่นๆ ในรุ่น CrUX ในเดือนมิถุนายน 2020 จะมีการบันทึกหน้าเว็บที่แสดงผ่านแคช AMP และ / หรือแสดงผลในโปรแกรมเปิด AMP ด้วย และระบุแหล่งที่มาเป็น URL ของหน้าเว็บของผู้เผยแพร่เนื้อหา

คุณภาพของข้อมูล

ข้อมูลใน CrUX จะได้รับการประมวลผลเล็กน้อยเพื่อให้มั่นใจว่ามีความถูกต้องทางสถิติ มีโครงสร้างที่ดี และสามารถค้นหาได้ง่าย

การกรอง

ระบบจะกรองชุดข้อมูล CrUX เพื่อให้แน่ใจว่าข้อมูลที่แสดงมีความถูกต้องทางสถิติ ซึ่งอาจยกเว้นหน้าเว็บหรือต้นทางทั้งหน้าไม่ให้ปรากฏในชุดข้อมูล

นอกจากเกณฑ์การมีสิทธิ์ที่มีผลกับต้นทางและหน้าเว็บแล้ว ยังมีการกรองเพิ่มเติมสําหรับกลุ่มภายในข้อมูลอีกด้วย ดังนี้

ต้นทางหรือหน้าที่มีการยกเว้นมากกว่า 20% ของการเข้าชมทั้งหมดเนื่องจากมีการรวมมิติข้อมูลที่ไม่มีสิทธิ์จะไม่รวมอยู่ในชุดข้อมูลทั้งหมด

เนื่องจากชุดข้อมูลระดับสากลครอบคลุมประสบการณ์ของผู้ใช้จากทุกประเทศ ชุดค่าผสมของมิติข้อมูลที่ไม่เป็นไปตามเกณฑ์ความนิยมในระดับประเทศจึงอาจยังคงรวมอยู่ในระดับสากลหากได้รับความนิยมมากพอ

ผ้าห่ม

จะมีการสุ่มจำนวนเล็กน้อยกับชุดข้อมูลเพื่อป้องกันการทำวิศวกรรมย้อนกลับกับข้อมูลที่ละเอียดอ่อน เช่น ปริมาณการเข้าชมทั้งหมด การดำเนินการนี้ไม่มีผลต่อความถูกต้องของสถิติโดยรวม

ความแม่นยำ

ค่าเมตริกส่วนใหญ่ภายในชุดข้อมูล CrUX จะแสดงเป็นฮิสโตแกรมของค่าและขนาด Bin โดยค่าฮิสโตแกรมเป็นเศษส่วนของกลุ่มที่รวมไว้ทั้งหมดรวมเป็น 1 ขนาด Bin เป็นตัวเลขทศนิยมระหว่าง 1.0 และ 0.0001

ฮิสโตแกรมความกว้างของ Bin ถูกทำให้เป็นมาตรฐานเพื่อให้การค้นหาและการแสดงผลลัพธ์ข้อมูลเป็นไปได้ง่ายขึ้น ซึ่งหมายความว่าถังขยะขนาดใหญ่อาจแบ่งออกเป็นถังขยะขนาดเล็กๆ ซึ่งมีความหนาแน่นเท่าเดิมเพื่อรักษาความกว้างของถังให้เท่ากัน

ใบอนุญาต

ชุดข้อมูล CrUX โดย Google ได้รับอนุญาตภายใต้ Creative Commons Attribution 4.0 International License