วิดีโอการช่วยเหลือพิเศษได้รับรางวัลเว็บจากการแข่งขันนักพัฒนาซอฟต์แวร์ Gemini API

Alexandra Klepper
Alexandra Klepper

เผยแพร่เมื่อวันที่ 21 พฤศจิกายน 2024

หลังจากได้รับผลงานที่ยอดเยี่ยมมากมายในการแข่งขันนักพัฒนา Gemini API เราได้เลือกผู้ชนะสำหรับเว็บแอปพลิเคชันที่ดีที่สุดแล้ว ซึ่งก็คือ ViddyScribe

ViddyScribe แสดงให้เห็นว่า Gemini ช่วยให้วิดีโอบน YouTube เข้าถึงได้ง่ายขึ้นได้อย่างไร และอาจขยายการให้บริการไปยังแพลตฟอร์มอื่นๆ ด้วยการสร้างคำบรรยายแทนเสียงสำหรับวิดีโอทุกรายการที่ปรับให้เหมาะกับผู้ที่มีความบกพร่องทางสายตา

ฟีเจอร์และความสามารถของ Gemini

ViddyScribe ได้สร้างแอปพลิเคชันที่ออกแบบมาเพื่อผู้ใช้เป็นหลัก แม้ว่าจะมีโซลูชันมากมายที่สร้างขึ้นเพื่อจัดทำข้อความถอดเสียงและคำบรรยายแทนเสียงอยู่แล้ว แต่ ViddyScribe ให้ความสำคัญกับการสร้างเอาต์พุตที่ให้ความสำคัญทั้งกับผลลัพธ์ที่รวดเร็วและประสบการณ์การใช้งานที่ยอดเยี่ยมสำหรับกลุ่มเป้าหมายที่เฉพาะเจาะจง ได้แก่ ผู้ที่บกพร่องทางสายตา

การกำกับเนื้อหาวิดีโอด้วยตนเองเพื่อแสดงรายละเอียดเพิ่มเติมแก่กลุ่มเป้าหมายนี้ใช้เวลานานเกินไปและมักถูกละเลย ViddyScribe ใช้ Gemini เพื่อช่วยสร้างโซลูชันที่ปรับแต่งได้ซึ่งปรับขนาดได้มากกว่าการเพิ่มคำอธิบายเฟรมแบบกำหนดเองลงในไฟล์ข้อความ

ViddyScribe มีตัวอย่าง 2 รายการและพื้นที่อัปโหลด
แอป ViddyScribe อนุญาตให้ผู้ใช้ใช้วิดีโอตัวอย่างหรืออัปโหลดวิดีโอของตัวเอง (ขนาดไม่เกิน 100 MB และความยาวไม่เกิน 2 นาที) เพื่อสร้างคำบรรยายแทนเสียงด้วย Gemini

ViddyScribe ใช้การปรับแต่งพรอมต์เพื่อรับผลลัพธ์ที่ดีที่สุด โดยดูแลจัดการภาษาและสไตล์คำถามสำหรับ Gemini 1.5 Pro พรอมต์นี้ใช้พรอมต์ตามลำดับความคิดเพื่อขอข้อมูลต่อไปนี้

  • วัตถุประสงค์และบริบทของวิดีโอ
  • เสียงบรรยายที่ปรับให้เหมาะกับผู้ใช้แต่ละรายโดยใช้การวิเคราะห์และหลักเกณฑ์เฉพาะวิดีโอ
  • จัดรูปแบบการประทับเวลาและคำอธิบายใหม่เพื่อให้เป็นรูปแบบที่สอดคล้องกันและคาดการณ์ได้

เหตุผลที่เราเลือก ViddyScribe

เราเลือก ViddyScribe เพราะเป็นโซลูชันที่ยอดเยี่ยมในการแก้ปัญหาของผู้ใช้

แม้ว่าจะพบว่ามีแอปพลิเคชันอื่นๆ ในตลาดที่ให้บริการคำบรรยายแทนเสียง แต่พวกเขารู้สึกว่าแอปพลิเคชันเหล่านั้นยังไม่เข้าใจความต้องการทั้งหมดของบุคคลที่เป็นผู้หูหนวกและผู้พิการทางสายตา นักพัฒนาแอปเหล่านี้ได้ทำงานร่วมกับบุคคลจริงที่มีความบกพร่องเหล่านี้เพื่อพิจารณาว่าแอปพลิเคชันคำบรรยายแทนเสียงควรมีลักษณะอย่างไร

ประสบการณ์ของผู้พิการอาจแตกต่างกันไปอย่างมาก และบางครั้งผู้พิการอาจต้องการสิ่งที่แตกต่างกัน นอกจากนี้ คำบรรยายแทนเสียงยังช่วยให้วิดีโอเหล่านี้เข้าถึงได้สำหรับผู้ที่มีความผิดปกติของระบบประสาทและผู้ที่ชอบอ่านข้อความถอดเสียงแทนการดูวิดีโอ

เราตื่นเต้นที่จะได้เห็นนักพัฒนาแอปปรับปรุง ViddyScribe อย่างต่อเนื่องเพื่อขยายกลุ่มเป้าหมายและความสามารถในอนาคต

สร้างต่อด้วย AI API ในตัว

ViddyScribe เป็นเพียงแอปพลิเคชันที่น่าทึ่งเพียงแอปเดียวที่คุณสร้างด้วย Gemini

เรากําลังพัฒนา AI ในตัว: API ของแพลตฟอร์มเว็บและฟีเจอร์เบราว์เซอร์ที่ออกแบบมาเพื่อผสานรวมโมเดล AI รวมถึงโมเดลภาษาขนาดใหญ่ (LLM) เข้ากับเบราว์เซอร์โดยตรง ซึ่งรวมถึง Gemini Nano ซึ่งเป็น LLM ตระกูล Gemini เวอร์ชันที่มีประสิทธิภาพมากที่สุด ซึ่งออกแบบมาเพื่อทำงานแบบออนโลนในคอมพิวเตอร์เดสก์ท็อปและแล็ปท็อปที่ทันสมัยที่สุด

สำรวจ API ที่พร้อมใช้งานเพื่อเริ่มสร้างเว็บไซต์ เว็บแอปพลิเคชัน และส่วนขยาย Chrome ที่มีประสิทธิภาพ

แชร์สิ่งที่คุณสร้างกับเราได้ที่ @ChromiumDev หรือแชร์กับChrome สําหรับนักพัฒนาซอฟต์แวร์ใน LinkedIn