مجموعة ناعمة قابلة للتوسع للفصل البُعدي ثلاثي الأبعاد على السحابات النقطية

تتناول هذه الورقة شبكة تُعرف باسم SoftGroup لتقديم تقسيم ثلاثي الأبعاد للInstances بدقة وقابلية للتوسع. تعتمد الطرق الرائدة حاليًا على إنتاج تنبؤات صريحة (Hard) للسمات، تليها عملية تجميع نتائج التقسيم حسب الـInstances. لكن من المؤسف أن الأخطاء الناتجة عن القرارات الصريحة تنتشر في مرحلة التجميع، ما يؤدي إلى تداخل ضعيف بين الـInstances المتنبأ بها والواقع الحقيقي، بالإضافة إلى عدد كبير من الأخطاء الإيجابية الكاذبة (False Positives). ولحل المشكلات المذكورة أعلاه، يسمح SoftGroup لكل نقطة بالارتباط بفئات متعددة، مما يخفف من عدم اليقين الناتج عن التنبؤ بالسمات. كما يقلل SoftGroup من الـFalse Positives من خلال تعلم تصنيفها كخلفية (Background). أما من حيث القابلية للتوسع، فإن الطرق السريعة الحالية تتطلب وقت معالجة يبلغ عشرات الثواني في المشاهد الضخمة، وهو ما يُعد غير مقبول ويُبعد التطبيق في الوقت الفعلي. وجدنا أن وحدة k-أقرب جار (k-NN)، التي تمثل شرطًا مسبقًا للعملية التجميعية، تُشكل عائقًا حسابيًا رئيسيًا. ولحل هذا العائق، تم توسيع SoftGroup ليُعرف باسم SoftGroup++، حيث يقلل SoftGroup++ من التعقيد الزمني باستخدام k-NN على هيكل octree، ويقلل من مساحة البحث باستخدام التوسع الهرمي المُدرك للصفة (Class-aware Pyramid Scaling) والفك التبديلة (Late Devoxelization) في مرحلة لاحقة. أظهرت النتائج التجريبية على عدة مجموعات بيانات داخلية وخارجية فعالية وشمولية SoftGroup وSoftGroup++. حيث تفوقت أداؤهما على أفضل نموذج قاعدة (Baseline) بنسبة كبيرة تتراوح بين 6% إلى 16% من حيث AP$_{50}$. وفي مجموعات البيانات التي تحتوي على مشاهد ضخمة، حقق SoftGroup++ ميزة في السرعة تبلغ 6 أضعاف متوسطًا مقارنة بـ SoftGroup. علاوةً على ذلك، يمكن توسيع SoftGroup لتنفيذ كلاً من كشف الكائنات (Object Detection) وتقسيم البانوتيك (Panoptic Segmentation) مع تحسينات ملحوظة مقارنة بالطرق الحالية. يُمكن الوصول إلى كود المصدر والنموذج المدرب عبر الرابط: \url{https://github.com/thangvubk/SoftGroup}.