ما يهم في التدفق البصري غير المراقب

نقوم بمقارنة وتحليل منهجي لسلسلة من المكونات الأساسية في تدفق الصور غير المُشرَّف بهدف تحديد أي دالة تباينية ضوئية، وكيفية التعامل مع المناطق المُغطاة، ونوع تنظيم السلس، هو الأكثر فعالية. وبالإضافة إلى هذه الدراسة، نُنشئ عددًا من التحسينات الجديدة لنماذج تدفق الصور غير المُشرَّف، مثل تطبيع حجم التكلفة (cost volume normalization)، ووقف التدرج عند قناع التغطية (occlusion mask)، وتشجيع السلس قبل رفع دقة حقل التدفق، بالإضافة إلى التدريب المستمر غير المُشرَّف باستخدام إعادة تشكيل الصورة (image resizing). وبدمج نتائج دراستنا مع المكونات المحسَّنة في النموذج، نقدم تقنية جديدة لتدفق الصور غير المُشرَّف، تتفوق بشكل ملحوظ على أحدث النماذج غير المُشرَّفة السابقة، وتُحقق أداءً يُعادل أداء نموذج FlowNet2 المُشرَّف على مجموعة بيانات KITTI 2015، مع أن النموذج الجديد يكون بشكل ملحوظ أبسط من الطرق ذات الصلة.