من الكبير إلى الصغير: إرشاد موضعي متعدد القياسات للتقدير الأحادي للعمق

تقدير العمق بدقة من صورة واحدة هو تحدي بسبب كونه مشكلة غير محددة بشكل جيد، حيث يمكن أن يتم إسقاط عدد لا نهائي من المشاهد ثلاثية الأبعاد إلى نفس المشهد ثنائي الأبعاد. ومع ذلك، تظهر الأعمال الحديثة التي تعتمد على الشبكات العصبية التلافيفية العميقة تقدماً كبيراً مع نتائج مقنعة. تتكون الشبكات العصبية التلافيفية عادةً من جزأين: مُشفِّر لاستخراج الميزات الكثيفة ومسحِّف لتوقع العمق المطلوب. في مخططات المُشفِّر-المسحِّف، تقوم طبقات التلافيف المتكررة ذات الخطوات الواسعة والطبقات الفضائية للتجزئة بخفض دقة الإخراج الانتقالي، ويتم اعتماد عدة تقنيات مثل الروابط القافزة أو الشبكات التحللية متعددة الطبقات لاستعادة الدقة الأصلية لتحقيق تنبؤ كثيف فعال. في هذا البحث، لتقديم إرشاد أكثر فعالية للميزات الكثيفة المشفرة نحو التوقع الدقيق للعمق، نقترح هندسة شبكة تستفيد من طبقات الإرشاد المستوية المحلية الجديدة والموجودة في مراحل متعددة من المرحلة الترميزية. نوضح أن الطريقة المقترحة تتفوق على الأعمال الرائدة الأخرى بمعدل كبير عند تقييمها على مقاييس صعبة. كما نقدم نتائج دراسة الاستبعاد لتثبت فعالية الطريقة المقترحة.