HyperAIHyperAI

Command Palette

Search for a command to run...

SVGA-Net: شبكة انتباه الرسم البياني المكاني النادر للكشف عن الأجسام ثلاثية الأبعاد من السحابة النقطية

Qingdong He Zhengning Wang Hao Zeng Yi Zeng Yijun Liu

الملخص

أصبح الكشف الدقيق عن الأجسام ثلاثية الأبعاد من سحابات النقاط عنصراً أساسياً في القيادة الذاتية. ومع ذلك، تفشل التمثيلات الحجمية والأساليب التقليدية للتصوير في إقامة علاقات بين مجموعات النقاط المحلية. في هذه الورقة، نقترح شبكة SVGA-Net ذات الانتباه الرسومي المتناثر (Sparse Voxel-Graph Attention Network)، وهي شبكة جديدة قابلة للتدريب من النهاية إلى النهاية، وتتكون أساساً من وحدة الرسم البياني للبُكَر (البُكَر الثلاثية) ووحدة الانحدار من النادر إلى الكثيف، بهدف تحقيق مهام كشف ثلاثية الأبعاد مماثلة من بيانات الليدار الخام. بشكل خاص، تقوم SVGA-Net ببناء رسم بياني كامل محلي داخل كل بُكَر ثلاثي كروي مقسَّم، ورسم بياني عالمي KNN عبر جميع البُكَر. تُستخدم الرسوم البيانية المحلية والعالمية كآلية انتباه لتعزيز السمات المستخرجة. بالإضافة إلى ذلك، تُحسّن وحدة الانحدار من النادر إلى الكثيف الجديدة دقة تقدير الصندوق الثلاثي الأبعاد من خلال تجميع خرائط السمات على مستويات مختلفة. أظهرت التجارب على معيار كشف KITTI كفاءة توسيع تمثيل الرسم البياني في الكشف عن الأجسام ثلاثية الأبعاد، كما أثبتت SVGA-Net قدرتها على تحقيق دقة كشف مقبولة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp