الاندماج متعدد المشاريع للتصنيف الدلالي في الوقت الفعلي للسحاب النقطي ثلاثي الأبعاد من ليدار

يُعد التصنيف الدلالي للسحابة النقطية ثلاثية الأبعاد أمراً ضرورياً لتعزيز الإدراك العالي المستوى في المنصات المستقلة. علاوة على ذلك، وبما أن استخدام مستشعرات ليدار في المركبات والطائرات المُسيرة يزداد بشكل متواصل، فإن التركيز يُركّز بشكل خاص على الخوارزميات غير المكلفة حسابياً التي تعمل على وحدات معالجة الرسوميات المحمولة (mobile GPUs). اعتمدت الطرق الرائدة الفعّالة السابقة على التصوير الكروي ثنائي الأبعاد للسحابة النقطية كمدخل لشبكات عصبية تلافيفية كاملة ثنائية الأبعاد، بهدف تحقيق توازن بين الدقة والسرعة. تقدم هذه الورقة منهجاً جديداً لتصنيف الدلالة في السحابة النقطية ثلاثية الأبعاد، يعتمد على استغلال عدة مُخرَجات تُولَّد من السحابة النقطية لتقليل فقدان المعلومات المتأصّل في الطرق التي تعتمد على تصوير واحد فقط. يحلل إطار عملنا المُسمى "الدمج متعدد المُخرَجات" (MPF) التصويرين الكروي والمنظور من الأعلى باستخدام نموذجين ثنائيي الأبعاد فعّالين جداً، ثم يدمج نتائج التصنيف الناتجة عن كلا المنظورين. وقد تم التحقق من أداء الإطار المقترح على مجموعة بيانات SemanticKITTI، حيث حقق متوسط دقة التداخل (mIoU) قدره 55.5، وهو ما يفوق الطرق الرائدة القائمة على التصوير مثل RangeNet++ وPolarNet، مع سرعة أعلى بـ 1.6 مرة مقارنة بـ RangeNet++ و3.1 مرة مقارنة بـ PolarNet.