HyperAIHyperAI
منذ 11 أيام

CAGroup3D: تجميع يراعي الفئة للكشف عن الكائنات ثلاثية الأبعاد على السحابات النقطية

Haiyang Wang, Lihe Ding, Shaocong Dong, Shaoshuai Shi, Aoxue Li, Jianan Li, Zhenguo Li, Liwei Wang
CAGroup3D: تجميع يراعي الفئة للكشف عن الكائنات ثلاثية الأبعاد على السحابات النقطية
الملخص

نقدّم إطارًا جديدًا للكشف عن الكائنات ثلاثية الأبعاد يعتمد على تكوين متعدد المراحل بالكامل باستخدام التباعد، يُسمّى CAGroup3D. تعتمد الطريقة المقترحة أولاً على إنشاء عدد من الاقتراحات ثلاثية الأبعاد عالية الجودة من خلال استغلال استراتيجية المجموعة المحلية المعتمدة على الفئة على مكعبات (Voxels) السطحية للكائنات التي تحمل تنبؤات ذاتية متماثلة، حيث تأخذ بعين الاعتبار الاتساق الدلالي والتنوع المحلي اللذين تجاهلهما النهجات السابقة من النوع السفلي (bottom-up). ثم، لاستعادة خصائص المكعبات المفقودة بسبب تجزئة مكعبية خاطئة، نبني وحدة تجميع RoI ثلاثية الأبعاد بالكامل باستخدام التباعد، والتي تجمع مباشرةً معلومات فضائية دقيقة من الشبكة الأساسية (backbone) لتحسين الاقتراحات بشكل أكبر. ويتميز هذا الإطار بالكفاءة في الذاكرة والحساب، ويُعدّ قادرًا على تمثيل خصائص هندسية محددة لكل اقتراح ثلاثي الأبعاد بشكل أفضل. تحقق النموذج أداءً قياسيًا في الكشف ثلاثي الأبعاد، مع مكاسب ملحوظة قدرها +3.6% على مجموعة بيانات ScanNet V2 و+2.6% على مجموعة بيانات SUN RGB-D من حيث مقياس [email protected]. سيتم إتاحة الشفرة المصدرية على الرابط: https://github.com/Haiyang-W/CAGroup3D.

CAGroup3D: تجميع يراعي الفئة للكشف عن الكائنات ثلاثية الأبعاد على السحابات النقطية | أحدث الأوراق البحثية | HyperAI