Yayınlanma tarihi: 21 Kasım 2024
Gemini API Geliştirici Yarışması'na gönderilen çok sayıda muhteşem çalışmanın ardından en iyi web uygulamasının kazananını belirledik: ViddyScribe.
ViddyScribe, Gemini'nin görme engelli kullanıcılara özel sesli açıklamalar oluşturarak videoların YouTube'da ve hatta daha geniş bir platformda daha erişilebilir hale getirilmesine nasıl yardımcı olabileceğini gösterir.
Özellikler ve Gemini özellikleri
ViddyScribe, kullanıcı odaklı bir uygulama oluşturdu. Transkript ve sesli açıklama oluşturmak için halihazırda birçok çözüm mevcut olsa da ViddyScribe, hem hızlı sonuçlara hem de belirli bir kitle için keyifli bir kullanıcı deneyimine (görme engelli kişiler) öncelik veren bir çıktı oluşturmaya öncelik verdi.
Bu kitleye ek ayrıntılar sunmak için videoların manuel olarak ek açıklamayla desteklenmesi çok zaman aldığından genellikle göz ardı edilir. ViddyScribe, bir metin dosyasına rastgele kare açıklamaları eklemenin ötesine geçen özel bir çözüm oluşturmak için Gemini'den yararlandı.
ViddyScribe, en iyi sonuçları elde etmek için istem mühendisliği yöntemini kullanarak Gemini 1.5 Pro için soru dilini ve tarzını belirledi. Bu istemde, düşünce zinciri istemi kullanılarak şunlar istendi:
- Videonun amacı ve bağlamı.
- Videoya özel analiz ve yönergeler kullanılarak özelleştirilmiş sesli açıklamalar.
- Zaman damgalarını ve açıklamaları, tahmin edilebilir ve tutarlı bir biçime göre yeniden biçimlendirin.
ViddyScribe'i neden tercih ettik?
Gerçek bir kullanıcı sorununa zarif bir çözüm sunması nedeniyle ViddyScribe'ı tercih ettik.
Piyasada işitsel açıklama sunan başka uygulamalar olduğunu fark etseler de işitme engelli ve görme engelli kullanıcıların ihtiyaçlarının tam olarak anlaşılmadığını hissettiler. Bu geliştiriciler, işitme engelli gerçek kişilerle birlikte çalışarak işitsel açıklama uygulamasında tam olarak neye ihtiyaç duyduklarını belirledi.
Engelli kullanıcıların deneyimleri büyük ölçüde değişiklik gösterebilir ve bazen çelişen ihtiyaçları olabilir. Ayrıca, sesli açıklamalar bu videoları, nörogelişimsel farklılığı olan kişiler ve video izlemek yerine transkript okumayı tercih edenler için de erişilebilir hâle getirebilir.
Geliştiricilerin ViddyScribe'i geliştirmeye devam ederek gelecekte kitleyi ve özellikleri genişletmesini heyecanla bekliyoruz.
Yerleşik yapay zeka API'leriyle geliştirmeye devam edin
ViddyScribe, Gemini ile oluşturduğunuz birçok harika uygulamadan yalnızca biriydi.
Yerleşik yapay zeka geliştiriyoruz: büyük dil modelleri (LLM'ler) dahil olmak üzere yapay zeka modellerini doğrudan tarayıcıya entegre etmek için tasarlanmış web platformu API'leri ve tarayıcı özellikleri. Bu kapsamda, Gemini LLM ailesinin en verimli sürümü olan ve en modern masaüstü ve dizüstü bilgisayarlarda yerel olarak çalışacak şekilde tasarlanmış Gemini Nano da yer alır.
Güçlü web siteleri, web uygulamaları ve Chrome uzantıları oluşturmaya başlamak için kullanılabilir API'leri keşfedin.
Oluşturduğunuz çalışmaları @ChromiumDev adresinden bizimle veya LinkedIn'deki Chrome for Developers ile paylaşın.