تاريخ النشر: 21 تشرين الثاني (نوفمبر) 2024
بعد تلقّي العديد من العينات الرائعة التي تم إرسالها إلى مسابقة مطوّري Gemini API، اختَرنا التطبيق الفائز بجائزة أفضل تطبيق ويب: ViddyScribe.
يوضّح تطبيق ViddyScribe كيف يمكن أن يساعد Gemini في تسهيل الوصول إلى الفيديوهات على YouTube، وربما خارجها، من خلال إنشاء أوصاف صوتية لأي فيديو مخصّصة للأشخاص الذين يعانون من ضعف البصر.
ميزات Gemini وإمكاناتها
أنشأت شركة ViddyScribe تطبيقًا مصمّمًا للمستخدمين أولاً. على الرغم من توفّر عدد من الحلول لإنشاء نصوص ووصف صوتي، منح فريق ViddyScribe الأولوية لإنشاء مخرجات تمنح الأولوية لكل من النتائج السريعة وتجربة مستخدم ملفتة لجمهور محدّد: الأشخاص الذين يعانون من عجز في الرؤية.
إنّ إضافة تعليقات توضيحية يدويًا إلى الفيديوهات لتقديم تفاصيل إضافية لهذا الجمهور يستغرق وقتًا طويلاً، وغالبًا ما يتم تجاهله. استخدَمت شركة ViddyScribe أداة Gemini للمساعدة في إنشاء حلّ مخصّص يمكن استخدامه على نطاق أوسع من مجرد إضافة بعض الأوصاف العشوائية للّقطات إلى ملف نصي.
استخدَمت شركة ViddyScribe هندسة الطلبات للحصول على أفضل النتائج، من خلال تنظيم لغة السؤال وأسلوبه في Gemini 1.5 Pro. استخدَم هذا الطلب توجيه سلسلة الأفكار لطلب ما يلي:
- الغرض من الفيديو وسياقه
- أوصاف صوتية مخصّصة باستخدام تحليل وإرشادات خاصة بالفيديو
- الطوابع الزمنية والأوصاف التي تمت إعادة تنسيقها لتوفير تنسيق متوقّع ومتسق
سبب اختيارنا ViddyScribe
اخترنا ViddyScribe لأنّه حلّ أنيق لمشكلة حقيقية يواجهها المستخدمون.
على الرغم من أنّهم وجدوا تطبيقات أخرى في السوق تقدّم وصفًا ملفًا صوتيًا، شعروا بأنّه لم يتم فهم احتياجات الأشخاص الصمّ والأعمى بشكل كامل. تعاون هؤلاء المطوّرون مع أشخاص حقيقيين مصابون بهذه الإعاقات لتحديد ما يحتاجون إليه بالضبط في تطبيق الوصف المسموع.
يمكن أن تختلف تجربة الأشخاص من ذوي الاحتياجات الخاصة بشكل كبير، وقد يكون لديهم أحيانًا احتياجات متضاربة. بالإضافة إلى ذلك، يمكن أن تجعل الأوصاف الصوتية هذه الفيديوهات متاحة للأشخاص الذين يعانون من اضطرابات في الجهاز العصبي وغيرهم ممن يفضّلون قراءة النص بدلاً من مشاهدة الفيديو.
نحن متحمّسون لرؤية المطوّرين يواصلون تحسين ViddyScribe، ما يؤدي إلى توسيع الجمهور وزيادة الإمكانات في المستقبل.
مواصلة الإنشاء باستخدام واجهات برمجة تطبيقات الذكاء الاصطناعي المضمّنة
كان تطبيق ViddyScribe واحدًا من التطبيقات الرائعة العديدة التي أنشأتها باستخدام Gemini.
نعمل على تطوير تكنولوجيات الذكاء الاصطناعي المضمّنة: واجهات برمجة تطبيقات لمنصّات الويب وميزات المتصفّح المصمّمة لدمج نماذج الذكاء الاصطناعي، بما في ذلك النماذج اللغوية الكبيرة (LLM)، مباشرةً في المتصفّح. ويشمل ذلك Gemini Nano، وهو الإصدار الأكثر فعالية من عائلة النماذج اللغوية الكبيرة Gemini، وهو مصمّم للتشغيل على الجهاز فقط على معظم أجهزة الكمبيوتر المكتبي والكمبيوتر المحمول الحديثة.
يمكنك الاطّلاع على واجهات برمجة التطبيقات المتاحة لبدء إنشاء تطبيقات ويب وتطبيقات ويب تقدّمية وإضافات Chrome فعّالة.
يمكنك مشاركة ما تصممه معنا على الرابط @ChromiumDev أو مشاركة الرابط مع Chrome للمطوّرين على LinkedIn.