تعزيز نماذج تقدير العمق من منظور واحد إلى دقة عالية من خلال دمج متعدد الدقة القائم على المحتوى

أظهرت الشبكات العصبية قدرات كبيرة في تقدير العمق من صورة واحدة. ومع ذلك، فإن الخرائط المُستنتجة للعمق تكون أقل من دقة ميغابكسل واحد غالبًا، وغالبًا ما تفتقر إلى التفاصيل الدقيقة، مما يحد من جدواها العملية. تعتمد طريقتنا على تحليلنا لتأثير كل من دقة الصورة المدخلة وهيكل المشهد على أداء تقدير العمق. ونُظهر أن هناك تنازُعًا بين الحفاظ على بنية مشهد متسقة والحفاظ على التفاصيل عالية التردد، ونُدمج التقديرات من الدقة المنخفضة والدقة العالية للاستفادة من هذه الثنائية باستخدام شبكة دمج بسيطة للعمق. ونُقدّم طريقة تقدير مزدوجة تُحسّن تقدير العمق على مستوى الصورة بأكملها، وطريقة اختيار للقطع تُضيف تفاصيل محلية إلى النتيجة النهائية. ونُثبت أن دمج التقديرات من مختلف دقة الصور مع تغير السياق يمكن أن يُنتج خرائط عمق متعددة الميغابكسل بمستوى عالٍ من التفاصيل باستخدام نموذج مُدرّب مسبقًا.