HyperAIHyperAI
منذ 7 أيام

الإنتاج المتنوع للفيديوهات باستخدام مُحفِّز عملية غاوسيّة

Gaurav Shrivastava, Abhinav Shrivastava
الإنتاج المتنوع للفيديوهات باستخدام مُحفِّز عملية غاوسيّة
الملخص

تُعدّ محاكاة الإطارات المستقبلية بناءً على عدد قليل من الإطارات السياقية (أو السابقة) مهمةً صعبة. فهي تتطلب نمذجة الاتساق الزمني في الفيديوهات، بالإضافة إلى التعددية في الطبيعة من حيث تنوع الحالات المستقبلية الممكنة. تميل النهج التغيرية الحالية لمحاكاة الفيديو إلى تعميم النتائج المستقبلية المتعددة الأشكال. بدلًا من ذلك، نقترح تمثيل التعددية في النتائج المستقبلية بشكل صريح، واستغلالها لاستخلاص مستقبلات متنوعة. يعتمد نهجنا، المُسمى "مُولّد الفيديو المتنوع"، على عملية غاوسيّة (GP) لتعلم الاحتمالات الأولية للحالات المستقبلية بناءً على الماضي، مع الحفاظ على توزيع احتمالي على جميع المستقبلات الممكنة بناءً على عينة معينة. علاوةً على ذلك، نستفيد من التغيرات في هذا التوزيع مع مرور الوقت لضبط عملية استخلاص الحالات المستقبلية المتنوعة، وذلك من خلال تقدير نهاية التسلسلات الجارية. بمعنى آخر، نستخدم التباين الناتج عن عملية غاوسيّة في فضاء الدالة الناتجة لتفعيل تغيير في تسلسل الإجراءات. ونحقق نتائج متميزة على مستوى توليد إطارات مستقبلية متنوعة من حيث جودة إعادة البناء وتنوع التسلسلات المولدة.

الإنتاج المتنوع للفيديوهات باستخدام مُحفِّز عملية غاوسيّة | أحدث الأوراق البحثية | HyperAI