التنبؤ الفيديوي المتغير العشوائي

تنبؤ المستقبل في البيئات الحقيقية، خاصة من الملاحظات الحسية الخام مثل الصور، يعد تحديًا استثنائيًا. يمكن أن تكون الأحداث الحقيقية عشوائية وغير قابلة للتنبؤ، وتحتاج نماذج التنبؤ إلى بناء فهم معقد للعالم الطبيعي بسبب البعد العالي والتعقيد في الصور الطبيعية. يتعامل العديد من الطرق الموجودة حاليًا مع هذه المشكلة عبر افتراضات تبسيطية حول البيئة. أحد الافتراضات الشائعة هو أن النتيجة محددة وهناك مستقبل واحد فقط محتمل. يمكن أن يؤدي هذا إلى تنبؤات منخفضة الجودة في بيئات حقيقية ذات ديناميكيات عشوائية. في هذا البحث، نطور طريقة التنبؤ المتغير العشوائي بالفيديو (SV2P) التي تتنبأ بمستقبل مختلف لكل عينة من متغيراتها الكامنة. وفي حد علمنا، فإن نموذجنا هو أول نموذج يقدم تنبؤًا متعدد الإطارات عشوائيًا فعالًا للفيديو الحقيقي. نظهر قدرة الطريقة المقترحة على تنبؤ الإطارات المستقبلية التفصيلية للفيديوهات في عدة مجموعات بيانات حقيقية، سواء كانت خالية من الأفعال أو مشروطة بالأفعال. وجدنا أن الطريقة المقترحة لدينا تنتج تنبؤات فيديو محسنة بشكل كبير عند مقارنتها بنفس النموذج بدون العشوائية، وبالمقارنة مع طرق أخرى للتنبؤ العشوائي بالفيديو. سيتم إتاحة كود تنفيذ SV2P مفتوح المصدر عند النشر.