ปัญญาประดิษฐ์ (AI) ครอบคลุมเทคโนโลยีที่ซับซ้อนและเกิดใหม่มากมาย ซึ่งครั้งหนึ่งเคยต้องใช้ข้อมูลจากมนุษย์ แต่ตอนนี้คอมพิวเตอร์สามารถทำงานได้แล้ว กล่าวโดยกว้าง AI คือโปรแกรมหรือโมเดลที่ไม่ใช่มนุษย์ซึ่งแสดงให้เห็นถึง ความสามารถในการแก้ปัญหาและความคิดสร้างสรรค์ที่หลากหลาย
มักมีการใช้ตัวย่อ AI สลับกันเพื่อแสดงถึงเทคโนโลยีประเภทต่างๆ ภายในสาขาปัญญาประดิษฐ์ แต่เทคโนโลยีเหล่านี้อาจมีขอบเขตที่แตกต่างกันอย่างมาก
มีคำศัพท์และแนวคิด หลายอย่างที่ให้คำจำกัดความของปัญญาประดิษฐ์และแมชชีนเลิร์นนิง ซึ่งคุณอาจพบว่ามีประโยชน์ ที่นี่คุณจะเห็นคำศัพท์ที่ใช้กันทั่วไปในเอกสารประกอบของ Chrome โดยเฉพาะอย่างยิ่ง เกี่ยวกับ AI ฝั่งไคลเอ็นต์
AI ฝั่งไคลเอ็นต์
แม้ว่าฟีเจอร์ AI ส่วนใหญ่บนเว็บจะอาศัยเซิร์ฟเวอร์ แต่ AI ฝั่งไคลเอ็นต์จะทำงาน ในเบราว์เซอร์ของผู้ใช้และทำการอนุมานในอุปกรณ์ของผู้ใช้ ซึ่งมีประโยชน์มากมาย เช่น เวลาในการตอบสนองที่ต่ำลง ลดต้นทุนในการสร้างฟีเจอร์ เพิ่มความเป็นส่วนตัวของผู้ใช้ และการเข้าถึงแบบออฟไลน์
AI ฝั่งไคลเอ็นต์ใช้โมเดลขนาดเล็กที่ได้รับการเพิ่มประสิทธิภาพ ซึ่งเพิ่มประสิทธิภาพเพื่อการทำงาน โมเดลดังกล่าวอาจมีประสิทธิภาพเหนือกว่าโมเดลฝั่งเซิร์ฟเวอร์ขนาดใหญ่กว่าสำหรับงานบางอย่าง ประเมินกรณีการใช้งานเพื่อพิจารณาว่าโซลูชันใดเหมาะกับคุณ
AI ในตัว
AI ในตัวเป็น AI ฝั่งไคลเอ็นต์รูปแบบหนึ่ง ซึ่งโมเดลขนาดเล็กกว่าจะฝังอยู่ในเบราว์เซอร์ สำหรับ Chrome จะรวมถึงโมเดล Gemini Nano และโมเดลผู้เชี่ยวชาญ เมื่อดาวน์โหลดโมเดลเหล่านี้แล้ว เว็บไซต์และเว็บแอปพลิเคชันทั้งหมดที่ใช้ AI ในตัวจะข้ามเวลาดาวน์โหลดและไปยังการดำเนินการฟีเจอร์และการอนุมานในเครื่องได้ทันที
API ของ AI ในตัวออกแบบมาเพื่อเรียกใช้การอนุมาน กับโมเดลประเภทที่เหมาะสมสำหรับงาน เช่น Prompt API จะเรียกใช้การอนุมานกับโมเดลภาษา ขณะที่ Translator API จะเรียกใช้การอนุมานกับ โมเดลผู้เชี่ยวชาญในตัว
AI ฝั่งเซิร์ฟเวอร์
AI ฝั่งเซิร์ฟเวอร์ครอบคลุมบริการ AI บนระบบคลาวด์ ลองนึกถึง Gemini 1.5 Pro ที่ทำงานบนระบบคลาวด์ โมเดลเหล่านี้มักจะมีขนาดใหญ่กว่าและมีประสิทธิภาพมากกว่า โดยเฉพาะอย่างยิ่งโมเดลภาษาขนาดใหญ่
AI แบบไฮบริด
AI แบบไฮบริดหมายถึงโซลูชันใดก็ตามที่มีทั้งคอมโพเนนต์ไคลเอ็นต์และเซิร์ฟเวอร์ เช่น
- โมเดลฝั่งไคลเอ็นต์ที่มีการสำรองข้อมูลไปยังโมเดลฝั่งเซิร์ฟเวอร์ ซึ่งสร้างขึ้นสำหรับงานที่ไม่สามารถทำได้อย่างมีประสิทธิภาพในอุปกรณ์
- อุปกรณ์อาจมีทรัพยากรไม่เพียงพอ
- โมเดลหรือ API พร้อมใช้งานในบางสภาพแวดล้อมเท่านั้น
- โมเดลที่แยกกันระหว่างไคลเอ็นต์และเซิร์ฟเวอร์เพื่อความปลอดภัย
- เช่น คุณอาจแยกโมเดลเพื่อให้การดำเนินการ 75% เกิดขึ้นในไคลเอ็นต์ ส่วนอีก 25% จะดำเนินการในเซิร์ฟเวอร์ ซึ่งจะช่วยให้ไคลเอ็นต์ได้รับประโยชน์ ขณะเดียวกันก็อนุญาตให้โมเดลบางส่วนอยู่นอกอุปกรณ์ได้ จึงยังคงความเป็นส่วนตัวไว้
หากใช้ Prompt API คุณจะตั้งค่า สถาปัตยกรรมแบบไฮบริดด้วย Firebase AI Logic ได้
Generative AI
Generative AI เป็นรูปแบบหนึ่งของแมชชีนเลิร์นนิง ที่ช่วยให้ผู้ใช้สร้างเนื้อหาที่ดูคุ้นเคยและเลียนแบบการสร้างสรรค์ของมนุษย์ Generative AI ใช้โมเดลภาษาเพื่อจัดระเบียบข้อมูลและสร้างหรือแก้ไข ข้อความ รูปภาพ วิดีโอ และเสียง โดยอิงตามบริบทที่ให้ไว้ Generative AI ทำงานได้ มากกว่าการจับคู่รูปแบบและการคาดการณ์
โมเดลภาษาขนาดใหญ่ (LLM) มีพารามิเตอร์จำนวนมาก (สูงสุดหลายพันล้าน) ที่คุณใช้เพื่อทำงานได้หลากหลาย เช่น การสร้าง การจัดประเภท หรือการสรุปข้อความหรือรูปภาพ
โมเดลภาษาขนาดเล็ก (SLM) มีพารามิเตอร์น้อยกว่ามาก ในการทำงานที่คล้ายกัน และอาจใช้ได้ที่ฝั่งไคลเอ็นต์
การประมวลผลภาษาธรรมชาติ (NLP)
การประมวลผลภาษาธรรมชาติเป็นคลาสของ ML ที่มุ่งเน้นการช่วยให้คอมพิวเตอร์เข้าใจภาษาของมนุษย์ ตั้งแต่กฎของภาษาใดภาษาหนึ่งไปจนถึงลักษณะเฉพาะ สำเนียง และคำสแลงที่แต่ละคนใช้
ตัวแทนหรือ AI Agent
เอเจนต์คือ ซอฟต์แวร์ที่วางแผนและดำเนินการตามชุดการดำเนินการต่างๆ โดยอัตโนมัติเพื่อทำงาน ให้เสร็จสมบูรณ์ในนามของผู้ใช้ พร้อมปรับตัวให้เข้ากับการเปลี่ยนแปลงในสภาพแวดล้อม การดำเนินการ อาจรวมถึงฟังก์ชัน API หรือการค้นหาฐานข้อมูลที่ดำเนินการในหน้าเว็บหรือผ่าน แอปพลิเคชันของบุคคลที่สาม เช่น Project Mariner
แชทบ็อตไม่ได้เป็นเอเจนต์โดยธรรมชาติ ในขณะที่แชทบ็อตจะตอบกลับผู้ส่งข้อความ (ไม่ว่าจะเป็นมนุษย์หรืออย่างอื่น) และอาศัยโมเดลในการสร้างเนื้อหา เช่น คำตอบสำหรับคำถาม เอเจนต์จะโต้ตอบกับเครื่องมือหรือฐานข้อมูลเพื่อทำงานให้เสร็จสมบูรณ์
อินพุตและเอาต์พุต
อินพุตและเอาต์พุตของโมเดลอาจอยู่ในรูปแบบต่างๆ เช่น ข้อความ รูปภาพ เสียง และวิดีโอ โมเดลอาจรับได้เพียงรูปแบบเดียวหรือหลายรูปแบบ (โมเดลหลายรูปแบบ) คุณควรยืนยันรูปแบบที่คุณต้องการก่อน เลือกโมเดล
คุณสามารถส่งและรับอินพุตและเอาต์พุตในรูปแบบก้อนข้อมูลการสตรีมหรือแบบอิงตามคำขอ
สตรีมมิง
การสตรีมจะแบ่งทรัพยากรที่คุณส่งหรือรับ ออกเป็นส่วนเล็กๆ เพื่อให้ผลลัพธ์แบบเรียลไทม์ เอาต์พุตจะปรับเปลี่ยน อย่างต่อเนื่องเมื่อมีการเพิ่มและปรับอินพุต
ซึ่งเป็นเทคนิคทั่วไปที่เบราว์เซอร์ใช้ในการรับชิ้นงานสื่อ เช่น การบัฟเฟอร์วิดีโอหรือการโหลดรูปภาพบางส่วน
เอาต์พุตตามคำขอ
สำหรับเอาต์พุตที่อิงตามคำขอ (หรือ "แบบไม่สตรีมมิง") โมเดลจะรอให้ระบบสร้างอินพุตทั้งหมด ประมวลผลอินพุตนั้นทั้งหมด แล้วจึงสร้าง เอาต์พุต
เช่น ในบริบทของหน้าต่างแชท แทนที่จะสร้างโมดอลเพื่อสร้างคำตอบขณะที่ผู้ใช้พิมพ์ โมเดลจะรอจนกว่าผู้ใช้จะคลิกปุ่มส่ง เมื่อส่งข้อความแล้ว โมเดลจะพิจารณาข้อมูลที่ป้อนทั้งหมด แล้วจึงตอบกลับ
แหล่งข้อมูลเพิ่มเติม
หากคุณเพิ่งเริ่มใช้ AI บนเว็บ โปรดดูคอลเล็กชันแหล่งข้อมูล AI ของ web.dev