HyperAIHyperAI
منذ 4 أشهر

شبكة باقي التحليل البعدية المستندة إلى RGBD لاستكمال المشهد الدلالي ثلاثي الأبعاد

Jie Li; Yu Liu; Dong Gong; Qinfeng Shi; Xia Yuan; Chunxia Zhao; Ian Reid
شبكة باقي التحليل البعدية المستندة إلى RGBD لاستكمال المشهد الدلالي ثلاثي الأبعاد
الملخص

الصور ذات الألوان الحمراء والخضراء والزرقاء (RGB) تختلف عن الصور العميقة في أنها تحمل المزيد من التفاصيل حول معلومات اللون والنسيج، والتي يمكن استخدامها كمكمل حيوي للعمق لتعزيز أداء إكمال المشهد الدلالي ثلاثي الأبعاد (SSC). يتكون SSC من إكمال الشكل ثلاثي الأبعاد (SC) وتصنيف المشهد الدلالي، بينما تستخدم معظم الطرق الحالية العمق كمدخل وحيد مما يسبب رقبة الزجاجة في الأداء. بالإضافة إلى ذلك، تعتمد الطرق الرائدة على شبكات الـ CNN ثلاثية الأبعاد التي تتضمن شبكات معقدة ومعلمات هائلة. نقدم شبكة متبقية مفككة بُعدياً خفيفة الوزن (DDR) لمهام التنبؤ الكثيف ثلاثي الأبعاد. طبقة التحليل العاملي الجديدة فعالة في تقليل معلمات الشبكة، والآلية المقترحة للدمج متعدد المقياس بين الصورة العميقة وصورة اللون يمكن أن تحسن دقة الإكمال والتقسيم في آن واحد. أثبتت طريقتنا أداءً ممتازًا على قاعدتي بيانات عامتين. بالمقارنة مع الطريقة الأخيرة SSCNet، حققنا زيادة بنسبة 5.9% في SC-IoU وزيادة بنسبة 5.7% في SSC-IoU، رغم استخدامنا فقط 21% من معلمات الشبكة و16.6% من العمليات العددية (FLOPs) مقارنة بـ SSCNet.