HyperAIHyperAI
منذ 8 أيام

نمذجة التفتيت المرنة للفيديوهات الطويلة

William Harvey, Saeid Naderiparizi, Vaden Masrani, Christian Weilbach, Frank Wood
نمذجة التفتيت المرنة للفيديوهات الطويلة
الملخص

نقدّم إطارًا لنمذجة الفيديو يستند إلى نماذج الاحتمالات التفاضلية المُزالة للضوضاء، والتي تُنتج اكتمالات فيديو طويلة المدة في مجموعة متنوعة من البيئات الواقعية. ونُقدّم نموذجًا توليديًا يمكنه في وقت الاختبار عينة أي مجموعة عشوائية من إطارات الفيديو مشروطة بأي مجموعة أخرى، ونعرض بنية مُعدّلة لهذا الغرض. وبذلك، نتمكن من مقارنة وتحسين مجموعة متنوعة من الجداول الزمنية لترتيب عينة الإطارات في فيديو طويل، واستخدام تكيّف مُختار نادر وطويل المدى مع الإطارات التي تم عينتها سابقًا. ونُظهر تحسينًا في نمذجة الفيديو مقارنة بالعمل السابق على عدة مجموعات بيانات، ونُنتج فيديوهات مُتسلسلة زمنيًا تتجاوز 25 دقيقة في الطول. كما نُطلق في هذا السياق مجموعة بيانات جديدة لنمذجة الفيديو، ومقاييس ذات دلالة معنوية مبنية على مقاطع فيديو تم إنشاؤها باستخدام محاكي القيادة الذاتية CARLA.

نمذجة التفتيت المرنة للفيديوهات الطويلة | أحدث الأوراق البحثية | HyperAI