تاريخ النشر: 21 نوفمبر 2024
بعد تلقّي العديد من المشاركات الرائعة في مسابقة مطوّري Gemini API، اخترنا الفائز بأفضل تطبيق ويب: ViddyScribe.
توضّح أداة ViddyScribe كيف يمكن أن يساعد Gemini في تسهيل الوصول إلى الفيديوهات على YouTube، وربما على منصات أخرى، من خلال إنشاء أوصاف صوتية لأي فيديو مخصّصة للمستخدمين الذين يعانون ضعفًا في البصر.
الميزات وإمكانات Gemini
أنشأت ViddyScribe تطبيقًا مصمّمًا وفقًا لاحتياجات المستخدمين أولاً. على الرغم من توفّر عدد من الحلول لإنشاء نصوص وفيديوهات تتضمّن وصفًا صوتيًا، إلا أنّ ViddyScribe ركّزت على إنشاء مخرجات تعطي الأولوية لكل من النتائج السريعة وتجربة المستخدم الممتعة لشريحة محدّدة من الجمهور، وهي الأشخاص الذين يعانون ضعفًا في البصر.
تستغرق إضافة تعليقات توضيحية يدويًا إلى الفيديوهات لتقديم تفاصيل إضافية لهذا الجمهور وقتًا طويلاً جدًا، وغالبًا ما يتم إهمالها. استخدمت ViddyScribe Gemini للمساعدة في إنشاء حلّ مخصّص يتجاوز إضافة بعض أوصاف الإطارات العشوائية إلى ملف نصي.

استخدمت ViddyScribe هندسة الطلبات للحصول على أفضل النتائج، حيث تم اختيار لغة السؤال وأسلوبه بما يتناسب مع Gemini 1.5 Pro. استخدم هذا الطلب أسلوب توجيه سلسلة الأفكار لطلب ما يلي:
- الغرض من الفيديو وسياقه
- أوصاف صوتية مخصّصة تستند إلى تحليل وإرشادات خاصة بالفيديو
- إعادة تنسيق الطوابع الزمنية والأوصاف للحصول على تنسيق يمكن توقّعه وثابت
سبب اختيارنا ViddyScribe
لقد اخترنا ViddyScribe لأنّه كان حلاً أنيقًا لمشكلة حقيقية يواجهها المستخدمون.
وعلى الرغم من أنّهم وجدوا تطبيقات أخرى في السوق تقدّم وصفًا صوتيًا، إلا أنّهم شعروا بأنّ احتياجات الصم وضعاف البصر لم يتم فهمها بالكامل. وقد تعاون هؤلاء المطوّرون مع أشخاص حقيقيين يعانون من هذه الإعاقات لتحديد احتياجاتهم بدقة في تطبيق الوصف الصوتي.
تختلف تجارب الأشخاص ذوي الاحتياجات الخاصة بشكل كبير، وقد تتضارب احتياجاتهم أحيانًا. بالإضافة إلى ذلك، يمكن أن تتيح الأوصاف الصوتية أيضًا مشاهدة هذه الفيديوهات للأشخاص الذين يعانون من اختلافات عصبية ولغيرهم ممّن يفضّلون قراءة نص الفيديو بدلاً من مشاهدته.
نحن متحمّسون لمعرفة كيف سيواصل المطوّرون تحسين ViddyScribe وتوسيع نطاق الجمهور والإمكانات في المستقبل.
مواصلة إنشاء التطبيقات باستخدام واجهات برمجة تطبيقات الذكاء الاصطناعي المدمجة
كان ViddyScribe مجرد أحد التطبيقات الرائعة العديدة التي أنشأتها باستخدام Gemini.
نحن بصدد تطوير ذكاء اصطناعي مدمج: واجهات برمجة تطبيقات لمنصة الويب وميزات في المتصفح مصمّمة لدمج نماذج الذكاء الاصطناعي، بما في ذلك النماذج اللغوية الكبيرة (LLM)، مباشرةً في المتصفح. ويشمل ذلك Gemini Nano، وهو الإصدار الأكثر كفاءة من عائلة نماذج اللغة الكبيرة Gemini، والمصمَّم للعمل على معظم أجهزة الكمبيوتر المكتبية والمحمولة الحديثة.
يمكنك الاطّلاع على واجهات برمجة التطبيقات المتاحة لبدء إنشاء مواقع إلكترونية وتطبيقات ويب وإضافات Chrome فعّالة.
يمكنك مشاركة ما أنشأته معنا على @ChromiumDev أو مشاركته مع Chrome for Developers على LinkedIn.