ทำความเข้าใจการจัดการโมเดลในตัวใน Chrome

Thomas Steiner

เผยแพร่: 21 ตุลาคม 2025

ความสามารถของ AI ในตัวที่ขับเคลื่อนโดย Gemini Nano ได้รับการออกแบบมาให้ใช้งานได้อย่างราบรื่นสำหรับทั้งผู้ใช้และนักพัฒนาแอป เมื่อคุณ ใช้ AI API ในตัว การจัดการโมเดลจะเกิดขึ้นโดยอัตโนมัติใน เบื้องหลัง เอกสารนี้อธิบายวิธีที่ Chrome จัดการการดาวน์โหลด อัปเดต และล้างข้อมูลโมเดล Gemini Nano

การดาวน์โหลดโมเดลครั้งแรก

เมื่อผู้ใช้ดาวน์โหลดหรืออัปเดต Chrome ระบบจะดาวน์โหลดตามคำขอ Gemini Nano เพื่อให้ Chrome ดาวน์โหลดโมเดลที่ถูกต้องสำหรับฮาร์ดแวร์ของผู้ใช้ การดาวน์โหลดโมเดลเริ่มต้นจะเกิดขึ้นเมื่อมีการเรียกใช้*.create() ฟังก์ชัน (เช่น Summarizer.create()) เป็นครั้งแรกของ AI API ในตัว ที่ขึ้นอยู่กับ Gemini Nano เมื่อเกิดกรณีนี้ขึ้น Chrome จะทำการตรวจสอบหลายครั้งเพื่อพิจารณา แนวทางปฏิบัติที่ดีที่สุด ก่อนอื่น Chrome จะประมาณประสิทธิภาพ GPU ของอุปกรณ์โดยการเรียกใช้ Shader ที่เป็นตัวแทน โดยพิจารณาจากผลลัพธ์เหล่านี้ ระบบจะตัดสินใจว่าจะดำเนินการอย่างใดอย่างหนึ่งต่อไปนี้

ดาวน์โหลด Gemini Nano เวอร์ชันที่ใหญ่ขึ้นและมีความสามารถมากขึ้น (เช่น พารามิเตอร์ 4B)
ดาวน์โหลดโมเดล Gemini Nano ที่มีขนาดเล็กและมีประสิทธิภาพมากขึ้น (เช่น พารามิเตอร์ 2 พันล้าน)
กลับไปใช้การอนุมานที่อิงตาม CPU หากอุปกรณ์เป็นไปตามข้อกำหนดแบบคงที่ที่แยกต่างหาก หากอุปกรณ์ไม่เป็นไปตามข้อกำหนดของฮาร์ดแวร์ ระบบจะไม่ดาวน์โหลดโมเดล

กระบวนการดาวน์โหลดได้รับการออกแบบมาให้มีความยืดหยุ่น ดังนี้

หากการเชื่อมต่ออินเทอร์เน็ตถูกขัดจังหวะ การดาวน์โหลดจะดำเนินการต่อจาก จุดที่ค้างไว้เมื่อกลับมาเชื่อมต่ออีกครั้ง
หากปิดแท็บที่ทริกเกอร์การดาวน์โหลด การดาวน์โหลดจะดำเนินต่อไป ในเบื้องหลัง
หากปิดเบราว์เซอร์ ระบบจะดาวน์โหลดต่อเมื่อรีสตาร์ทครั้งถัดไป โดยมีเงื่อนไขว่าเบราว์เซอร์ต้องเปิดภายใน 30 วัน

บางครั้งการโทรหา availability() อาจทำให้ระบบดาวน์โหลดโมเดล เหตุการณ์นี้จะเกิดขึ้น หากมีการโทรหลังจากที่โปรไฟล์ผู้ใช้ใหม่เริ่มต้นขึ้นไม่นาน และหากฟีเจอร์ การตรวจหาการหลอกลวงที่ทำงานด้วย Gemini Nano เปิดใช้งานอยู่

ดาวน์โหลดน้ำหนัก LoRA

API บางรายการ เช่น Proofreader API จะใช้ประโยชน์จากน้ำหนักของ Low-Rank Adaptation (LoRA) ซึ่งใช้กับโมเดลพื้นฐานเพื่อปรับฟังก์ชันการทำงานให้เฉพาะเจาะจง หาก API ขึ้นอยู่กับ LoRA ระบบจะดาวน์โหลดน้ำหนักของ LoRA พร้อมกับโมเดลพื้นฐาน ระบบจะไม่ดาวน์โหลดน้ำหนัก LoRA สำหรับ API อื่นๆ โดยอัตโนมัติ

การอัปเดตโมเดลอัตโนมัติ

เราจะเผยแพร่การอัปเดตโมเดล Gemini Nano เป็นประจำ Chrome จะตรวจสอบ การอัปเดตเหล่านี้เมื่อเบราว์เซอร์เริ่มต้น นอกจากนี้ Chrome ยังตรวจสอบ การอัปเดตทรัพยากรเสริม เช่น น้ำหนัก LoRA ทุกวันด้วย แม้ว่าคุณจะค้นหาเวอร์ชันโมเดลจาก JavaScript โดยใช้โปรแกรมไม่ได้ แต่ก็ตรวจสอบเวอร์ชันที่ติดตั้งด้วยตนเองได้ ใน chrome://on-device-internals กระบวนการอัปเดตได้รับการออกแบบมาให้ราบรื่นและไม่หยุดชะงัก

Chrome จะยังคงทำงานด้วยโมเดลปัจจุบันขณะดาวน์โหลดเวอร์ชันใหม่ในเบื้องหลัง
เมื่อดาวน์โหลดโมเดลที่อัปเดตแล้ว ระบบจะสลับโมเดลอย่างรวดเร็ว ซึ่งหมายความว่าระบบจะสลับโมเดลโดยไม่มีการหยุดทำงาน การเรียกใช้ AI API ใหม่จะใช้โมเดลใหม่ทันที หมายเหตุ: พรอมต์ที่ทำงานในขณะที่สลับอาจล้มเหลว
การอัปเดตแต่ละครั้งเป็นการดาวน์โหลดโมเดลใหม่ทั้งหมด ไม่ใช่การดาวน์โหลดบางส่วน เนื่องจากน้ำหนักของโมเดลอาจแตกต่างกันอย่างมากในแต่ละเวอร์ชัน และอาจใช้เวลานานในการคำนวณและใช้เดลต้าสำหรับไฟล์ขนาดใหญ่เช่นนี้

การอัปเดตเป็นไปตามข้อกำหนดเดียวกันกับการดาวน์โหลดครั้งแรก อย่างไรก็ตาม ระบบจะไม่ตรวจสอบพื้นที่ว่างในดิสก์ครั้งแรกหากมีการติดตั้งโมเดลอยู่แล้ว นอกจากนี้ยังอัปเดตน้ำหนักของ LoRA ได้ด้วย ใช้ค่าน้ำหนัก LoRA เวอร์ชันใหม่กับโมเดลพื้นฐานที่มีอยู่ได้ อย่างไรก็ตาม โมเดลพื้นฐานเวอร์ชันใหม่จะต้องใช้ ชุดน้ำหนัก LoRA ใหม่เสมอ

การลบโมเดล

Chrome จะจัดการพื้นที่ดิสก์อย่างต่อเนื่องเพื่อให้ผู้ใช้มีพื้นที่เพียงพอ ระบบจะลบโมเดล Gemini Nano โดยอัตโนมัติหากพื้นที่ว่างในดิสก์ของอุปกรณ์ลดลง ต่ำกว่าเกณฑ์ที่กำหนด นอกจากนี้ ระบบจะล้างข้อมูลโมเดลหากนโยบายขององค์กรปิดใช้ฟีเจอร์ หรือหากผู้ใช้ไม่เป็นไปตามเกณฑ์การมีสิทธิ์อื่นๆ เป็นเวลา 30 วัน การมีสิทธิ์อาจรวมถึง การใช้งาน API และความสามารถของอุปกรณ์ กระบวนการล้างข้อมูลมีลักษณะดังนี้

คุณลบโมเดลได้ทุกเมื่อ แม้จะอยู่ระหว่างเซสชัน โดยไม่ต้องคำนึงถึงพรอมต์ที่กำลังทำงานอยู่ ซึ่งหมายความว่า API ที่พร้อมใช้งานเมื่อ เริ่มเซสชันอาจไม่พร้อมใช้งานกะทันหัน
หลังจากล้างข้อมูลแล้ว ระบบจะไม่ดาวน์โหลดโมเดลอีกครั้งโดยอัตโนมัติ แอปพลิเคชันต้องเป็นผู้ทริกเกอร์การดาวน์โหลดใหม่โดยการเรียกใช้ฟังก์ชัน *.create()
เมื่อล้างโมเดลพื้นฐาน ระบบจะล้างน้ำหนัก LoRA ที่เกี่ยวข้องด้วย หลังจากระยะเวลาผ่อนผัน 30 วัน

บทบาทของคุณในการจัดการโมเดล

การทำความเข้าใจวงจรของโมเดล AI ในตัวเป็นอย่างดีเป็นกุญแจสำคัญในการ มอบประสบการณ์การใช้งานที่เหมาะสมแก่ผู้ใช้ คุณยังดาวน์โหลดโมเดลไม่เสร็จ นอกจากนี้ คุณยังต้องทราบถึงความเป็นไปได้ที่โมเดลจะหายไปอีกครั้งอย่างกะทันหัน เนื่องจากพื้นที่ดิสก์เต็ม หรือโมเดลอาจได้รับการอัปเดตเมื่อมีเวอร์ชันใหม่ออกมา เบราว์เซอร์จะจัดการเรื่องนี้ให้ทั้งหมด

การปฏิบัติตามแนวทางปฏิบัติแนะนำเกี่ยวกับการดาวน์โหลดโมเดล จะช่วยให้คุณสร้างประสบการณ์ของผู้ใช้ที่ดีในการดาวน์โหลดครั้งแรก การดาวน์โหลดซ้ำ และ การอัปเดต