HyperAIHyperAI
منذ 11 أيام

SVGA-Net: شبكة انتباه الرسم البياني المكاني النادر للكشف عن الأجسام ثلاثية الأبعاد من السحابة النقطية

Qingdong He, Zhengning Wang, Hao Zeng, Yi Zeng, Yijun Liu
SVGA-Net: شبكة انتباه الرسم البياني المكاني النادر للكشف عن الأجسام ثلاثية الأبعاد من السحابة النقطية
الملخص

أصبح الكشف الدقيق عن الأجسام ثلاثية الأبعاد من سحابات النقاط عنصراً أساسياً في القيادة الذاتية. ومع ذلك، تفشل التمثيلات الحجمية والأساليب التقليدية للتصوير في إقامة علاقات بين مجموعات النقاط المحلية. في هذه الورقة، نقترح شبكة SVGA-Net ذات الانتباه الرسومي المتناثر (Sparse Voxel-Graph Attention Network)، وهي شبكة جديدة قابلة للتدريب من النهاية إلى النهاية، وتتكون أساساً من وحدة الرسم البياني للبُكَر (البُكَر الثلاثية) ووحدة الانحدار من النادر إلى الكثيف، بهدف تحقيق مهام كشف ثلاثية الأبعاد مماثلة من بيانات الليدار الخام. بشكل خاص، تقوم SVGA-Net ببناء رسم بياني كامل محلي داخل كل بُكَر ثلاثي كروي مقسَّم، ورسم بياني عالمي KNN عبر جميع البُكَر. تُستخدم الرسوم البيانية المحلية والعالمية كآلية انتباه لتعزيز السمات المستخرجة. بالإضافة إلى ذلك، تُحسّن وحدة الانحدار من النادر إلى الكثيف الجديدة دقة تقدير الصندوق الثلاثي الأبعاد من خلال تجميع خرائط السمات على مستويات مختلفة. أظهرت التجارب على معيار كشف KITTI كفاءة توسيع تمثيل الرسم البياني في الكشف عن الأجسام ثلاثية الأبعاد، كما أثبتت SVGA-Net قدرتها على تحقيق دقة كشف مقبولة.

SVGA-Net: شبكة انتباه الرسم البياني المكاني النادر للكشف عن الأجسام ثلاثية الأبعاد من السحابة النقطية | أحدث الأوراق البحثية | HyperAI