SLAMP: التنبؤ العشوائي بالملامح والحركة الخفية

الحركة تمثل مؤشراً مهماً في توقع الفيديو، وغالباً ما تُستخدم من خلال تقسيم محتوى الفيديو إلى مكونات ثابتة وديناميكية. تعتمد معظم الدراسات السابقة التي تستخدم الحركة على نماذج حتمية، إلا أن هناك طرقاً عشوائية قادرة على نمذجة عدم اليقين المتأصل في المستقبل. تُعد النماذج العشوائية الحالية إما غير قادرة على التفكير بشكل صريح في الحركة، أو تفرض افتراضات محدودة بشأن الجزء الثابت. في هذه الورقة، نتعامل مع المظهر والحركة في الفيديو بشكل عشوائي من خلال التنبؤ بالمستقبل بناءً على تاريخ الحركة. بل إن التفكير الصريح في الحركة دون استخدام التاريخ يحقق أداءً مماثلاً للنماذج العشوائية الحالية. أما تاريخ الحركة فيحسن النتائج بشكل إضافي من خلال تمكين التنبؤ بديناميكيات متسقة على مدى عدة إطارات مستقبلية. تُظهر نماذجنا أداءً مماثلاً للنماذج الرائدة في مجموعات بيانات توقع الفيديو العامة، لكنها تتفوق بشكل ملحوظ عليها في مجموعتي بيانات واقعية صعبة تتعلق بالقيادة الذاتية، حيث تتميز بحركة معقدة وخلفيات ديناميكية.