منذ 11 أيام
LocalBins: تحسين تقدير العمق من خلال تعلُّم التوزيعات المحلية
Shariq Farooq Bhat, Ibraheem Alhashim, Peter Wonka

الملخص
نُقدِّم معمارية جديدة لتقدير العمق من صورة واحدة. تعتمد هذه المعمارية على الهيكل الشهير المُكوَّن من مُشفِّر (Encoder) ومُفكِّك (Decoder)، الذي يُستخدم غالبًا كنقطة انطلاق لجميع مهام الانحدار الكثيف. نبني على تقنية AdaBins التي تقدّر التوزيع العالمي لقيم العمق بالنسبة للصورة المدخلة، ونطوّر المعمارية ب طريقتين. أولاً، بدلًا من التنبؤ بتوزيع العمق العالمي، نتنبأ بتوزيعات العمق للجيران المحليين عند كل بكسل. ثانيًا، بدلًا من التنبؤ بتوزيعات العمق فقط في نهاية مرحلة المُفكِّك، نشغّل جميع طبقات المُفكِّك. نسمّي هذه المعمارية الجديدة LocalBins. تُظهر نتائجنا تحسنًا واضحًا مقارنة بأفضل النماذج الحالية في جميع المقاييس على مجموعة بيانات NYU-Depth V2. سيتم إتاحة الكود والنماذج المُدرّبة مسبقًا للجمهور.