เผยแพร่เมื่อวันที่ 21 พฤศจิกายน 2024
หลังจากได้รับผลงานที่ยอดเยี่ยมมากมายในการแข่งขันนักพัฒนา Gemini API เราได้เลือกผู้ชนะสำหรับเว็บแอปพลิเคชันที่ดีที่สุดแล้ว ซึ่งก็คือ ViddyScribe
ViddyScribe แสดงให้เห็นว่า Gemini ช่วยให้วิดีโอบน YouTube เข้าถึงได้ง่ายขึ้นได้อย่างไร และอาจขยายการให้บริการไปยังแพลตฟอร์มอื่นๆ ด้วยการสร้างคำบรรยายแทนเสียงสำหรับวิดีโอทุกรายการที่ปรับให้เหมาะกับผู้ที่มีความบกพร่องทางสายตา
ฟีเจอร์และความสามารถของ Gemini
ViddyScribe ได้สร้างแอปพลิเคชันที่ออกแบบมาเพื่อผู้ใช้เป็นหลัก แม้ว่าจะมีโซลูชันมากมายที่สร้างขึ้นเพื่อจัดทำข้อความถอดเสียงและคำบรรยายแทนเสียงอยู่แล้ว แต่ ViddyScribe ให้ความสำคัญกับการสร้างเอาต์พุตที่ให้ความสำคัญทั้งกับผลลัพธ์ที่รวดเร็วและประสบการณ์การใช้งานที่ยอดเยี่ยมสำหรับกลุ่มเป้าหมายที่เฉพาะเจาะจง ได้แก่ ผู้ที่บกพร่องทางสายตา
การกำกับเนื้อหาวิดีโอด้วยตนเองเพื่อแสดงรายละเอียดเพิ่มเติมแก่กลุ่มเป้าหมายนี้ใช้เวลานานเกินไปและมักถูกละเลย ViddyScribe ใช้ Gemini เพื่อช่วยสร้างโซลูชันที่ปรับแต่งได้ซึ่งปรับขนาดได้มากกว่าการเพิ่มคำอธิบายเฟรมแบบกำหนดเองลงในไฟล์ข้อความ
ViddyScribe ใช้การปรับแต่งพรอมต์เพื่อรับผลลัพธ์ที่ดีที่สุด โดยดูแลจัดการภาษาและสไตล์คำถามสำหรับ Gemini 1.5 Pro พรอมต์นี้ใช้พรอมต์ตามลำดับความคิดเพื่อขอข้อมูลต่อไปนี้
- วัตถุประสงค์และบริบทของวิดีโอ
- เสียงบรรยายที่ปรับให้เหมาะกับผู้ใช้แต่ละรายโดยใช้การวิเคราะห์และหลักเกณฑ์เฉพาะวิดีโอ
- จัดรูปแบบการประทับเวลาและคำอธิบายใหม่เพื่อให้เป็นรูปแบบที่สอดคล้องกันและคาดการณ์ได้
เหตุผลที่เราเลือก ViddyScribe
เราเลือก ViddyScribe เพราะเป็นโซลูชันที่ยอดเยี่ยมในการแก้ปัญหาของผู้ใช้
แม้ว่าจะพบว่ามีแอปพลิเคชันอื่นๆ ในตลาดที่ให้บริการคำบรรยายแทนเสียง แต่พวกเขารู้สึกว่าแอปพลิเคชันเหล่านั้นยังไม่เข้าใจความต้องการทั้งหมดของบุคคลที่เป็นผู้หูหนวกและผู้พิการทางสายตา นักพัฒนาแอปเหล่านี้ได้ทำงานร่วมกับบุคคลจริงที่มีความบกพร่องเหล่านี้เพื่อพิจารณาว่าแอปพลิเคชันคำบรรยายแทนเสียงควรมีลักษณะอย่างไร
ประสบการณ์ของผู้พิการอาจแตกต่างกันไปอย่างมาก และบางครั้งผู้พิการอาจต้องการสิ่งที่แตกต่างกัน นอกจากนี้ คำบรรยายแทนเสียงยังช่วยให้วิดีโอเหล่านี้เข้าถึงได้สำหรับผู้ที่มีความผิดปกติของระบบประสาทและผู้ที่ชอบอ่านข้อความถอดเสียงแทนการดูวิดีโอ
เราตื่นเต้นที่จะได้เห็นนักพัฒนาแอปปรับปรุง ViddyScribe อย่างต่อเนื่องเพื่อขยายกลุ่มเป้าหมายและความสามารถในอนาคต
สร้างต่อด้วย AI API ในตัว
ViddyScribe เป็นเพียงแอปพลิเคชันที่น่าทึ่งเพียงแอปเดียวที่คุณสร้างด้วย Gemini
เรากําลังพัฒนา AI ในตัว: API ของแพลตฟอร์มเว็บและฟีเจอร์เบราว์เซอร์ที่ออกแบบมาเพื่อผสานรวมโมเดล AI รวมถึงโมเดลภาษาขนาดใหญ่ (LLM) เข้ากับเบราว์เซอร์โดยตรง ซึ่งรวมถึง Gemini Nano ซึ่งเป็น LLM ตระกูล Gemini เวอร์ชันที่มีประสิทธิภาพมากที่สุด ซึ่งออกแบบมาเพื่อทำงานแบบออนโลนในคอมพิวเตอร์เดสก์ท็อปและแล็ปท็อปที่ทันสมัยที่สุด
สำรวจ API ที่พร้อมใช้งานเพื่อเริ่มสร้างเว็บไซต์ เว็บแอปพลิเคชัน และส่วนขยาย Chrome ที่มีประสิทธิภาพ
แชร์สิ่งที่คุณสร้างกับเราได้ที่ @ChromiumDev หรือแชร์กับChrome สําหรับนักพัฒนาซอฟต์แวร์ใน LinkedIn