استكشاف القدرة المحتملة لتقدير العمق الأحادي المعتمد على التعلم ذاتيًا

تُلعب الطرق ذاتية التعلّم دورًا متزايد الأهمية في تقدير العمق من صورة واحدة بفضل إمكاناتها الكبيرة وانخفاض تكلفة التسمية. وللتقليل من الفجوة بين هذه الطرق والطرق المراقبة، اعتمدت الدراسات الحديثة على قيود إضافية، مثل التصنيف الدلالي. ومع ذلك، فإن هذه الأساليب تؤدي بالضرورة إلى زيادة العبء على النموذج. في هذا البحث، نقدم أدلة نظرية وتجريبية تُظهر أن القدرة المحتملة لتقدير العمق من صورة واحدة ذاتية التعلّم يمكن استغلالها دون زيادة هذه التكلفة. وبشكل خاص، نقترح (1) منهجية جديدة لتعزيز البيانات تُسمى "الربط البياناتي" (data grafting)، التي تُجبر النموذج على استكشاف مزيد من المؤشرات لاستنتاج العمق، بخلاف الموضع الرأسي في الصورة، (2) خسارة ذاتية استكشافية للتمييز الذاتي، تُدرَّب باستخدام التسمية الناتجة عن طريقة ما بعد المعالجة الجديدة التي أطلقنا عليها اسم "المعالجة ما بعد التحديد" (selective post-processing)، و(3) شبكة شاملة (full-scale network)، صُممت لمنح المشفر (encoder) خاصية التخصص في مهمة تقدير العمق، وتعزيز قدرة النموذج على التمثيل. أظهرت التجارب الواسعة أن مساهماتنا تُحدث تحسينًا كبيرًا في الأداء بالنسبة للنموذج الأساسي، حتى مع تقليل التكاليف الحسابية، كما أن نموذجنا، المسمى EPCDepth، تفوق الطرق الرائدة السابقة، بما في ذلك تلك التي تُدرَّب باستخدام قيود إضافية.