วิธีการ CrUX

ส่วนนี้จะแสดงวิธีที่ CrUX รวบรวมและจัดระเบียบข้อมูลประสบการณ์ของผู้ใช้

การมีสิทธิ์

หัวใจของชุดข้อมูล CrUX คือประสบการณ์ของผู้ใช้แต่ละคน ซึ่งรวบรวมไว้ในการกระจายระดับหน้าเว็บและระดับต้นทาง ส่วนนี้จะแสดงการมีสิทธิ์ของผู้ใช้ รวมถึงข้อกำหนดสำหรับหน้าและต้นทางที่จะรวมไว้ในชุดข้อมูล ต้องเป็นไปตามเกณฑ์การมีสิทธิ์ทั้งหมด ระบบจึงจะรวมประสบการณ์การใช้งานไว้ในข้อมูลระดับหน้าเว็บที่มีให้บริการใน PageSpeed Insights และ CrUX API ซึ่งได้แก่ ผู้ใช้ ต้นทาง และหน้าเว็บ ประสบการณ์การใช้งานที่ตรงกับเกณฑ์ผู้ใช้และต้นทางแต่ไม่ใช่ "หน้า" จะไม่รวมอยู่ในข้อมูลระดับต้นทางที่มีอยู่ในแหล่งข้อมูล CrUX ทั้งหมด

ระบบจะรวมหน้าและต้นทางออกจากชุดข้อมูลโดยอัตโนมัติหากการมีสิทธิ์มีการเปลี่ยนแปลงเมื่อเวลาผ่านไป ในตอนนี้ คุณส่งหน้าเว็บหรือต้นทางมารวมด้วยตนเองไม่ได้

ค้นพบได้แบบสาธารณะ

หน้าเว็บต้องค้นพบได้แบบสาธารณะจึงจะถือว่ารวมอยู่ในชุดข้อมูล CrUX

หน้าเว็บได้รับการกำหนดให้ค้นพบได้แบบสาธารณะโดยใช้เกณฑ์ความสามารถในการจัดทำดัชนีเดียวกันกับเครื่องมือค้นหา

หน้าเว็บไม่สามารถปฏิบัติตามข้อกำหนดด้านการค้นพบได้ หากเป็นไปตามเงื่อนไขใดๆ ต่อไปนี้ รวมถึงหน้าเว็บรูทสำหรับชุดข้อมูลต้นทาง

  • หน้าเว็บแสดงด้วยรหัสสถานะ HTTP ที่ไม่ใช่ 200 (หลังจากเปลี่ยนเส้นทาง)
  • หน้าเว็บแสดงด้วยส่วนหัว HTTP X-Robots-Tag: noindexหรือที่เทียบเท่า
  • เอกสารดังกล่าวมีเมตาแท็ก <meta name="robots" content="noindex"> หรือเทียบเท่า

โปรดดูภาพรวมสถานะการจัดทำดัชนีของเว็บไซต์ที่ Google Search Console

ได้รับความนิยมมากพอ

หน้าเว็บจะถือว่าได้รับความนิยมเพียงพอเมื่อมีจํานวนผู้เข้าชมขั้นต่ำ ต้นทางจะถือว่าได้รับความนิยมเพียงพอหากมีจำนวนผู้เข้าชมขั้นต่ำในหน้าเว็บทั้งหมด จะไม่เปิดเผยจำนวนที่แน่นอน แต่เลือกมาเพื่อให้เรามีตัวอย่างเพียงพอที่จะมั่นใจในการกระจายทางสถิติของหน้าเว็บที่รวมอยู่ จำนวนขั้นต่ำของหน้าเว็บและต้นทางจะเท่ากัน

หน้าและต้นทางที่ไม่เป็นไปตามเกณฑ์ความนิยมจะไม่รวมอยู่ในชุดข้อมูล CrUX

Origin

ต้นทางแสดงถึงเว็บไซต์ทั้งเว็บซึ่งระบุที่อยู่ได้ด้วย URL เช่น https://www.example.com ต้นทางที่จะรวมอยู่ในชุดข้อมูล CrUX ต้องเป็นไปตามข้อกำหนด 2 ข้อดังนี้

  1. ค้นพบได้แบบสาธารณะ
  2. เป็นที่นิยมพอ

คุณยืนยันว่าต้นทางค้นพบได้โดยเรียกใช้การตรวจสอบ Lighthouse แล้วดูผลลัพธ์ของหมวดหมู่ SEO เว็บไซต์จะไม่พบหากหน้ารูทไม่ผ่านการบล็อกหน้าเว็บไม่ให้จัดทำดัชนีหรือการตรวจสอบหน้าเว็บมีรหัสสถานะ HTTP ไม่สำเร็จ

หากมีการพิจารณาว่าต้นทางเปิดให้ค้นพบได้แบบสาธารณะ ระบบจะรวบรวมประสบการณ์ของผู้ใช้ที่มีสิทธิ์ในหน้าทั้งหมดของต้นทางดังกล่าวที่ระดับต้นทางโดยไม่คำนึงถึงการค้นพบหน้าเว็บแต่ละหน้า ประสบการณ์ทั้งหมดนี้ นับรวมกับข้อกำหนดความนิยมของต้นทาง

สำหรับวัตถุประสงค์ในการค้นหา โปรดทราบว่าต้นทางทั้งหมดในชุดข้อมูล CrUX เป็นตัวพิมพ์เล็ก

หน้าเว็บ

ข้อกำหนดสำหรับหน้าเว็บที่จะรวมไว้ในชุดข้อมูล CrUX จะเหมือนกับต้นทาง ดังนี้

  1. ค้นพบได้แบบสาธารณะ
  2. เป็นที่นิยมพอ

คุณยืนยันได้ว่าหน้าเว็บค้นพบได้โดยเรียกใช้การตรวจสอบ Lighthouse แล้วดูผลลัพธ์ของหมวดหมู่ SEO ระบบค้นหาหน้าเว็บของคุณไม่สำเร็จหากหน้าเว็บถูกบล็อกจากการจัดทำดัชนีหรือหน้าเว็บมีรหัสสถานะ HTTP ไม่สำเร็จ การตรวจสอบ

หากผู้ใช้บางรายค้นพบหน้าเว็บได้แบบสาธารณะ แต่แสดงผลสถานะ HTTP ที่ไม่สำเร็จในบางกรณี ประสบการณ์ดังกล่าวจะไม่รวมอยู่ใน CrUX

หน้าเว็บมักจะมีตัวระบุเพิ่มเติมใน URL รวมถึงพารามิเตอร์สตริงการค้นหา เช่น ?utm_medium=email และส่วนย่อย เช่น #main ตัวระบุเหล่านี้จะถูกตัดออกจาก URL ในชุดข้อมูล CrUX เพื่อรวมประสบการณ์ของผู้ใช้ทั้งหมดในหน้าเว็บไว้ด้วยกัน วิธีนี้มีประโยชน์สำหรับหน้าเว็บที่อาจไม่ผ่านเกณฑ์ความนิยม หากหน้าเดียวกันมีรูปแบบ URL ที่ไม่ต่อเนื่องจำนวนมาก โปรดทราบว่าในบางกรณีที่เกิดขึ้นไม่บ่อยนัก เหตุการณ์นี้อาจจัดกลุ่มประสบการณ์หน้าเว็บแต่ละหน้าเข้าด้วยกันโดยไม่คาดคิด เช่น หากพารามิเตอร์ ?productID=101 และ ?productID=102 แสดงถึงหน้าเว็บที่แตกต่างกัน

ระบบจะวัดหน้าใน CrUX ตามหน้าระดับบนสุด หน้าเว็บที่รวมเป็น iframe จะไม่มีการรายงานแยกต่างหากใน CrUX แต่ส่งผลต่อเมตริกของหน้าระดับบนสุด เช่น หาก https://www.example.com/page.html ฝัง https://www.example.com/frame.html ใน iframe ระบบจะแสดง page.html ไว้ใน CrUX (ขึ้นอยู่กับเกณฑ์การมีสิทธิ์อื่นๆ) แต่ frame.html จะไม่แสดง และหาก frame.html มี CLS ต่ำ ระบบจะรวม CLS ไว้ด้วยเมื่อวัด CLS สำหรับ page.html CrUX คือรายงานประสบการณ์ของผู้ใช้ของ Chrome ซึ่งผู้ใช้อาจไม่ทราบว่านี่คือ iframe ดังนั้น ระบบจะวัดประสบการณ์ในหน้าระดับบนสุดตามวิธีที่ผู้ใช้มองเห็น

สถาปัตยกรรมของเว็บไซต์อาจทำให้การแสดงข้อมูลใน CrUX มีความซับซ้อนยิ่งขึ้น ตัวอย่างเช่น แอปหน้าเดียว (SPA) อาจใช้รูปแบบการเปลี่ยนเส้นทางที่ใช้ JavaScript เพื่อย้ายไปมาระหว่างหน้า แทนที่จะเป็นการนำทางหน้าเว็บที่ใช้แท็ก Anchor แบบเดิม การเปลี่ยนเหล่านี้จะปรากฏเป็นการดูหน้าเว็บใหม่สำหรับผู้ใช้ แต่สำหรับ Chrome และ API ของแพลตฟอร์มที่ใช้งานอยู่ ประสบการณ์โดยรวมจะมาจากการดูหน้าเว็บเริ่มต้น นี่เป็นข้อจำกัดของ API แพลตฟอร์มเว็บที่สร้าง CrUX ขึ้น โปรดดูข้อมูลเพิ่มเติมที่สถาปัตยกรรม SPA ส่งผลต่อ Core Web Vitals บน web.dev อย่างไร

ผู้ใช้

ผู้ใช้ต้องมีคุณสมบัติตรงตามเกณฑ์ต่อไปนี้ จึงจะรวบรวมประสบการณ์ไว้ในชุดข้อมูล CrUX ได้

  1. เปิดใช้การรายงานสถิติการใช้งาน
  2. ซิงค์ประวัติเบราว์เซอร์
  3. ไม่ได้ตั้งค่ารหัสผ่านการซิงค์ไว้
  4. ใช้แพลตฟอร์มที่รองรับ

แพลตฟอร์มที่รองรับในปัจจุบันมีดังนี้

  • Chrome เวอร์ชันเดสก์ท็อป ซึ่งรวมถึงระบบปฏิบัติการ Windows, macOS, ChromeOS และ Linux
  • Chrome เวอร์ชัน Android รวมถึงแอปบนอุปกรณ์เคลื่อนที่ที่ใช้แท็บที่กำหนดเองและ WebAPKs

มีข้อยกเว้นที่สำคัญบางประการที่ไม่ได้ให้ข้อมูลไปยังชุดข้อมูล CrUX ดังนี้

  • Chrome ใน iOS
  • แอป Android ที่ใช้ WebView
  • เบราว์เซอร์ Chromium อื่นๆ (เช่น Microsoft Edge)

Chrome จะไม่เผยแพร่ข้อมูลเกี่ยวกับสัดส่วนของผู้ใช้ที่ตรงกับเกณฑ์เหล่านี้ คุณสามารถดูรายละเอียดเพิ่มเติมเกี่ยวกับข้อมูลที่เรารวบรวมได้ในสมุดปกขาวเรื่องความเป็นส่วนตัวของ Chrome

Accelerated Mobile Pages (AMP)

หน้าที่สร้างด้วย AMP จะรวมอยู่ในชุดข้อมูล CrUX เช่นเดียวกับหน้าเว็บอื่นๆ ตั้งแต่รุ่น CrUX ในเดือนมิถุนายน 2020 เป็นต้นไป หน้าที่แสดงโดยใช้แคช AMP และ / หรือที่แสดงผลในโปรแกรมเปิด AMP จะได้รับการบันทึกด้วย และระบุแหล่งที่มาเป็น URL หน้าเว็บของผู้เผยแพร่โฆษณา

คุณภาพของข้อมูล

ข้อมูลใน CrUX ผ่านการประมวลผลจำนวนเล็กน้อยเพื่อให้แน่ใจว่ามีความถูกต้องทางสถิติ มีโครงสร้างที่ดี และสืบค้นข้อมูลได้ง่ายขึ้น

การกรอง

ชุดข้อมูล CrUX ได้รับการกรองเพื่อให้มั่นใจว่าข้อมูลที่แสดงมีความถูกต้องทางสถิติ ซึ่งอาจยกเว้นทั้งหน้าเว็บหรือต้นทางไม่ให้ปรากฏในชุดข้อมูล

นอกจากเกณฑ์การมีสิทธิ์ที่ใช้กับต้นทางและหน้าเว็บแล้ว ระบบจะใช้การกรองเพิ่มเติมสำหรับกลุ่มภายในข้อมูลด้วย

ต้นทางหรือหน้าเว็บที่มีการเข้าชมมากกว่า 20% จากทั้งหมดที่ยกเว้นเนื่องจากชุดค่าผสมของมิติข้อมูลที่ไม่มีสิทธิ์จะไม่รวมอยู่ในชุดข้อมูลโดยสิ้นเชิง

เนื่องจากชุดข้อมูลระดับโลกครอบคลุมประสบการณ์ของผู้ใช้จากทุกประเทศ ชุดค่าผสมของมิติข้อมูลที่ไม่เป็นไปตามเกณฑ์ความนิยมในระดับประเทศจึงอาจยังรวมอยู่ในระดับโลกหากมีความนิยมเพียงพอ

เบลอ

ระบบจะใช้การสุ่มจำนวนเล็กน้อยกับชุดข้อมูลเพื่อป้องกันการทำวิศวกรรมย้อนกลับกับข้อมูลที่ละเอียดอ่อน เช่น ปริมาณการเข้าชมทั้งหมด แต่ไม่ส่งผลต่อความแม่นยําของสถิติโดยรวม

ความแม่นยำ

ค่าเมตริกส่วนใหญ่ภายในชุดข้อมูล CrUX จะแสดงเป็นฮิสโตแกรมของค่าและขนาด Bin โดยที่ค่าฮิสโตแกรมเป็นเศษส่วนของกลุ่มที่รวมไว้ทั้งหมดซึ่งรวมเป็น 1 ขนาด Bin เป็นจำนวนทศนิยมระหว่าง 1.0 ถึง 0.0001

มีการปรับความกว้างของ Bin ให้เป็นมาตรฐานฮิสโตแกรมเพื่อลดความซับซ้อนของการค้นหาและการแสดงภาพข้อมูล หมายความว่าถังขยะที่ใหญ่กว่านี้อาจแบ่งย่อยออกเป็นถังขยะขนาดเล็กได้ และใช้ความหนาแน่นเดิมเท่าๆ กันเพื่อรักษาความกว้างของถังขยะให้สอดคล้องกัน

ใบอนุญาต

ชุดข้อมูล CrUX โดย Google ได้รับอนุญาตภายใต้ Creative Commons Attribution 4.0 International License