RandLA-Net: التصنيف الدلالي الفعّال للسحابات النقطية الضخمة

ندرس مشكلة التجزئة الدلالية الفعّالة للسحابات ثلاثية الأبعاد ذات الحجم الكبير. تعتمد معظم الطرق الحالية على تقنيات عينة مكلفة أو خطوات ما قبل/بعد المعالجة ذات التكلفة الحسابية العالية، مما يحد من قدرتها على التدريب والتشغيل على السحابات ثلاثية الأبعاد الصغيرة فقط. في هذه الورقة، نقدّم RandLA-Net، وهي بنية عصبية فعّالة وخفيفة الوزن تُقدّر الدلالة لكل نقطة مباشرةً في السحابات ثلاثية الأبعاد الكبيرة. تكمن الفكرة الأساسية في استخدام عينة عشوائية للنقاط بدلًا من الطرق المعقدة لاختيار النقاط. وعلى الرغم من كفاءة العينة العشوائية من حيث الحوسبة والذاكرة، إلا أنها قد تُفقد ميزات أساسية عن طريق الصدفة. لتجاوز هذه المشكلة، نقدّم وحدة جديدة لجمع الميزات المحلية، تُعزز تدريجيًا مجال الاستجابة لكل نقطة ثلاثية الأبعاد، وبالتالي تُحافظ بكفاءة على التفاصيل الهندسية. أظهرت التجارب الواسعة أن RandLA-Net قادرة على معالجة مليون نقطة في عملية واحدة، وبسرعة تصل إلى 200 مرة أسرع من الطرق الحالية. علاوةً على ذلك، تتفوق RandLA-Net بشكل واضح على أحدث الطرق في التجزئة الدلالية على مBenchmarkين كبيرين: Semantic3D وSemanticKITTI.