HyperAIHyperAI
منذ 2 أشهر

DAOcc: الكشف عن الأجسام ثلاثية الأبعاد بمساعدة الاندماج متعدد الحساسات للتنبؤ بالاحتلال ثلاثي الأبعاد

Yang, Zhen ; Dong, Yanpeng ; Wang, Heng ; Ma, Lichao ; Cui, Zijian ; Liu, Qi ; Pei, Haoran
DAOcc: الكشف عن الأجسام ثلاثية الأبعاد بمساعدة الاندماج متعدد الحساسات للتنبؤ بالاحتلال ثلاثي الأبعاد
الملخص

الدمج متعدد الحساسات يعزز بشكل كبير الدقة والثبات في التنبؤ بالاحتلال الصرفي ثلاثي الأبعاد، وهو أمر حاسم للقيادة الذاتية والروبوتات. ومع ذلك، تعتمد معظم النهج الحالية على دقة صور عالية وشبكات معقدة لتحقيق أفضل الأداء، مما يعيق تطبيقها في السيناريوهات العملية. بالإضافة إلى ذلك، تركز معظم نماذج الدمج متعدد الحساسات على تحسين ميزات الدمج بينما تغفل عن استكشاف استراتيجيات الإشراف على هذه الميزات. بهدف حل هذه المشكلات، نقترح DAOcc، إطار عمل جديد للتنبؤ بالاحتلال متعدد الوسائط يستخدم إشراف الكشف عن الأجسام ثلاثية الأبعاد لمساعدته في تحقيق أداء متفوق، مع استخدام شبكة استخراج ميزات الصور الصديقة للنشر ودقة صورة مدخل عملية. علاوة على ذلك، نقدم استراتيجية توسيع نطاق الرؤية في المنظور الطولي (BEV View Range Extension) لتخفيف الآثار السلبية لخفض دقة الصورة. أظهرت النتائج التجريبية أن DAOcc حقق أداءً رائدًا جديدًا في مقاييس Occ3D-nuScenes وSurroundOcc، وتخطى الأساليب الأخرى بفارق كبير باستخدام ResNet50 فقط ودقة صورة المدخل 256*704. سيتم توفير الشفرة البرمجية في https://github.com/AlphaPlusTT/DAOcc.

DAOcc: الكشف عن الأجسام ثلاثية الأبعاد بمساعدة الاندماج متعدد الحساسات للتنبؤ بالاحتلال ثلاثي الأبعاد | أحدث الأوراق البحثية | HyperAI