شبكة القمع المتبادل للتنبؤ بالفيديو باستخدام الخصائص المنفصله

تُعتبر تنبؤ الفيديو مشكلة صعبة بسبب احتواء الفيديو ليس فقط على معلومات فضائية ذات أبعاد عالية، بل أيضًا على معلومات زمنية معقدة. يمكن تنفيذ تنبؤ الفيديو من خلال العثور على خصائص في الإطارات الأخيرة واستخدامها لإنشاء تقريبات للإطارات القادمة. نحن نعالج هذه المشكلة من خلال فصل الخصائص الفضائية والزمنية في مقاطع الفيديو. نقدم شبكة قمع متبادل (MSnet) التي يتم تدريبها بطريقة معادية ثم تنتج خصائص فضائية خالية من المعلومات الحركية، وخصائص حركية لا تحتوي على معلومات فضائية. تقوم MSnet باستخدام الاتصال الموجه بالحركة ضمن بنية مستندة إلى المُشفِّر والمُفكِّك لتحويل الخصائص الفضائية من إطار سابق إلى وقت الإطار القادم. نوضح كيف يمكن استخدام MSnet للتنبؤ بالفيديو باستخدام التمثيلات المنفصلة. كما نجري تجارب لتقييم فعالية طريقة فصل الخصائص لدينا. تحصل MSnet على نتائج أفضل من الأساليب الأخرى الحديثة للتنبؤ بالفيديو رغم أنها لديها مُشفِّرات أكثر بساطة.