HyperAIHyperAI
منذ 17 أيام

LiteFlowNet3: التغلب على الغموض في التقابل لتقدير تدفق بصري أكثر دقة

Tak-Wai Hui, Chen Change Loy
LiteFlowNet3: التغلب على الغموض في التقابل لتقدير تدفق بصري أكثر دقة
الملخص

لقد حققت النماذج القائمة على التعلم العميق نجاحًا كبيرًا في معالجة مشكلة تقدير التدفق البصري. تكمن أسباب هذا النجاح في استخدام حجم التكلفة (cost volume) والاستنتاج التدريجي من الخشنة إلى الدقيقة للتدفق. ومع ذلك، تصبح مشكلة المطابقة غير محددة بشكل جيد عندما توجد مناطق مُغطاة جزئيًا أو مناطق متجانسة في الصور. يؤدي ذلك إلى احتواء حجم التكلفة على قيم شاذة (outliers)، مما يؤثر سلبًا على عملية استخلاص التدفق منه. علاوةً على ذلك، يتطلب الاستنتاج التدريجي من الخشونة إلى الدقة تهيئة دقيقة للتدفق. وعند وجود تطابق غامض، ينتج تدفق خاطئ، مما يؤثر على استنتاجات التدفق في المستويات اللاحقة. في هذه الورقة، نقدم نموذج LiteFlowNet3، وهو شبكة عميقة مكوّنة من وحدتين متخصصتين، لمعالجة التحديات المذكورة أعلاه. (1) نُحسّن مشكلة القيم الشاذة في حجم التكلفة من خلال تعديل كل متجه تكلفة باستخدام منظور تكييفي (adaptive modulation) قبل عملية استخلاص التدفق. (2) نُعزّز دقة التدفق بشكل إضافي من خلال استكشاف الاتساق المحلي للتدفق. ولتحقيق ذلك، نستبدل كل تدفق بصري غير دقيق بقيمة دقيقة مستمدة من موقع قريب من خلال تقنية تدوير جديدة للحقل البصري (flow field). يحقق LiteFlowNet3 نتائج واعدة على المعايير العامة، ويتميز أيضًا بحجم نموذج صغير ووقت تشغيل سريع.