استبيان حول تقنيات التعلم العميق لتقدير العمق القائم على الاستيريو

تقدير العمق من الصور RGB يُعد مشكلة غير محددة جيدًا منذ فترة طويلة، وقد تم استكشافها على مدى عقود من قبل مجتمعات الرؤية الحاسوبية، والرسومات الحاسوبية، وتعلم الآلة. من بين التقنيات الحالية، لا يزال التوافق الثنائي (stereo matching) أحد أكثر الطرق شيوعًا في الأدبيات العلمية بفضل ارتباطه القوي بالنظام البصري الثنائي للإنسان. وتقليديًا، تم معالجة تقدير العمق القائم على التوافق الثنائي من خلال مطابقة السمات المصنوعة يدويًا عبر صور متعددة. وعلى الرغم من كثرة الأبحاث المبذولة، لا تزال هذه التقنيات التقليدية تعاني في ظل المناطق ذات النسيج العالي، والمناطق الموحدة الكبيرة، والمناطق المُغطاة (الإغلاق البصري). ومحفزةً بتفوقها المتزايد في حل مجموعة متنوعة من المشكلات البصرية ثنائية وثلاثية الأبعاد، أصبح التعلم العميق لتقدير العمق القائم على التوافق الثنائي موضوعًا يحظى باهتمام متزايد من المجتمع العلمي، حيث تم نشر أكثر من 150 ورقة بحثية في هذا المجال بين عامي 2014 و2019. وقد أظهرت هذه الجيل الجديد من الأساليب تقدمًا كبيرًا في الأداء، ما مكّن من تطبيقات مثل القيادة الذاتية وواقع التوسيع (augmented reality). في هذه المقالة، نقدم مراجعة شاملة لهذا المجال البحثي الجديد والمتزايد باستمرار، ونلخص الأنماط الأكثر شيوعًا المستخدمة، ونناقش مزاياها وقيودها. وعند النظر إلى ما تم تحقيقه حتى الآن، نستعرض أيضًا توقعاتنا لما قد يحمله المستقبل لبحث التعلم العميق القائم على التوافق الثنائي في تقدير العمق.