Command Palette
Search for a command to run...
العمق الداخلي المفرد المستوحى من التعلم الذاتي بشكل أعمق
العمق الداخلي المفرد المستوحى من التعلم الذاتي بشكل أعمق
Chao Fan Zhenyu Yin Yue Li Feiqing Zhang
الملخص
أظهرت تقنية تقدير العمق من منظور واحد باستخدام الشبكات العصبية التلافيفية (CNNs) أداءً ملحوظًا في المشاهد الخارجية للقيادة. ومع ذلك، فإن التعلم ذاتي التوجيه لتقدير العمق في البيئات الداخلية من تسلسلات منظور واحد يشكل تحديًا كبيرًا للباحثين، وذلك لأسباب رئيسية اثنتين: الأولى هي الوجود الواسع من المناطق ذات النسيج المنخفض، والثانية هي حركة المُستخدِم (ego-motion) المعقدة في مجموعات البيانات التدريبية الداخلية. في هذا العمل، يُقدَّم منهجنا المسمى IndoorDepth، والذي يحتوي على Innovations اثنتين. بشكل خاص، نُقدِّم أولًا خسارة فوتوغرافية جديدة تعتمد على دالة مُحسَّنة لتشابه البنية (SSIM) لمعالجة التحدي الناتج عن المناطق ذات النسيج المنخفض. علاوةً على ذلك، لتحسين التقليل من مشكلة تنبؤ حركة المُستخدِم غير الدقيقة، نستخدم خسائر فوتوغرافية متعددة في مراحل مختلفة لتدريب شبكة عميقة للوضع (pose network) تتضمن كتلاً متعددة للوضع المتبقية (residual pose blocks). وتمكّن الدراسة التحليلية اللاحقة من التحقق من فعالية كل فكرة جديدة. أظهرت التجارب على معيار NYUv2 أن منهجنا IndoorDepth يتفوق بشكل كبير على أحدث الطرق السابقة. وبالإضافة إلى ذلك، تم التحقق من قدرة التعميم لمنهجنا على مجموعة بيانات ScanNet. يمكن الوصول إلى الكود من خلال الرابط: https://github.com/fcntes/IndoorDepth.