HyperAIHyperAI
منذ 2 أشهر

بحث عن هياكل ثلاثية الأبعاد فعالة باستخدام التحويل النقطي-البكتلي النادر

Haotian Tang; Zhijian Liu; Shengyu Zhao; Yujun Lin; Ji Lin; Hanrui Wang; Song Han
بحث عن هياكل ثلاثية الأبعاد فعالة باستخدام التحويل النقطي-البكتلي النادر
الملخص

تحتاج السيارات ذاتية القيادة إلى فهم المشاهد ثلاثية الأبعاد بكفاءة ودقة لضمان القيادة الآمنة. نظرًا للموارد المادية المحدودة، فإن النماذج الحالية للإدراك الثلاثي الأبعاد غير قادرة على التعرف على الحالات الصغيرة (مثل المشاة والدراجين) بشكل جيد بسبب التجزئة المنخفضة الدقة والتنقيص العنيف. لتحقيق هذا الغرض، نقترح استخدام التحويل الشبكي النقاطي-البكسيلي النادر (Sparse Point-Voxel Convolution - SPVConv)، وهو وحدة ثلاثية الأبعاد خفيفة الوزن تزود التحويل الشبكي النادر التقليدي بفرع يعتمد على النقاط عالية الدقة. وبفضل زيادة طفيفة في العبء، يكون هذا الفرع القائم على النقاط قادرًا على الحفاظ على التفاصيل الدقيقة حتى من المشاهد الخارجية الكبيرة.لاستكشاف طيف النماذج ثلاثية الأبعاد الكفوءة، نحدد أولاً مساحة تصميم معمارية مرنة تستند إلى SPVConv، ثم نقدم البحث عن الهيكل العصبي الثلاثي الأبعاد (3D Neural Architecture Search - 3D-NAS) لاكتشاف هيكل الشبكة الأمثل عبر هذه المساحة التصميمية المتنوعة بكفاءة وفعالية. تؤكد النتائج التجريبية أن النموذج الناتج SPVNAS سريع ودقيق: فهو يتفوق على أفضل النماذج الحالية MinkowskiNet بنسبة 3.3% ويحتل المركز الأول في قائمة تصنيف SemanticKITTI التنافسية. كما أنه يحقق تخفيضًا حسابيًا بمقدار 8 أضعاف وزيادة في السرعة المقاسة بمقدار 3 أضعاف مقارنة بـ MinkowskiNet مع دقة أعلى. وأخيرًا، نقوم بنقل طريقتنا إلى اكتشاف الأجسام ثلاثية الأبعاد، حيث تحقق تحسينات مستقرة فوق خط الأساس للاكتشاف ذو المرحلة الواحدة في KITTI.

بحث عن هياكل ثلاثية الأبعاد فعالة باستخدام التحويل النقطي-البكتلي النادر | أحدث الأوراق البحثية | HyperAI