M4Depth: تقدير العمق من منظور واحد للمركبات ذاتية القيادة في بيئات غير معروفة

تقدير المسافة إلى الأجسام أمر بالغ الأهمية للمركبات ذاتية القيادة عندما يكون من المستحيل استخدام أجهزة استشعار العمق. وفي هذه الحالة، يجب تقدير المسافة من خلال كاميرات RGB المثبتة على متن المركبة، وهي مهمة معقدة خاصة في البيئات مثل المناظر الطبيعية الخارجية. في هذه الورقة، نقدّم طريقة جديدة تُسمى M4Depth لتقدير العمق. أولاً، نُنشأ علاقة تقابلية بين العمق والاختلاف البصري بين إطارين متتاليين، ونُبيّن كيفية استغلالها لتحقيق تقدير للعمق لكل بكسل بشكل مستقل عن الحركة. ثم نُفصّل طريقة M4Depth التي تعتمد على بنية شبكة عصبية تلافيفية هرمية، حيث تقوم كل طبقة بتحسين تقدير خريطة الاختلاف المدخلة باستخدام حجمين مخصصين للتكلفة. نستخدم هذين الحجمين للاستفادة من القيود المكانية الزمنية البصرية الناتجة عن الحركة، ولجعل الشبكة مقاومة للتغيرات في المشاهد المختلفة. قمنا بتقييم منهجنا في كلا النمطين: التقييم التجريبي والقدرة على التعميم، على مجموعات بيانات عامة تحتوي على مسارات كاميرات مُحاكاة تم تسجيلها في مجموعة واسعة من المشاهد الخارجية. تُظهر النتائج أن شبكتنا تتفوّق على أحدث الطرق المُتاحة على هذه المجموعات، كما تؤدي أداءً جيدًا على معيار قياسي لتقدير العمق. يُمكن الوصول إلى الكود الخاص بمنهجنا بشكل عام عبر الرابط التالي: https://github.com/michael-fonder/M4Depth.