MinkLoc3D: التعرف على الأماكن على نطاق واسع باستخدام السحابة النقطية

يقدم هذا البحث طريقة قائمة على التعلم لحساب وصف ثلاثي الأبعاد للسحابة النقطية (3D point cloud descriptor) لأغراض التعرف على المواقع. الطرق الحالية، مثل PointNetVLAD، تعتمد على تمثيل السحابة النقطية غير المرتبة. تستخدم هذه الطرق PointNet كخطوة أولى في المعالجة لاستخراج الخصائص المحلية، والتي يتم دمجها لاحقًا في وصف عالمي. ومع ذلك، فإن بنية PointNet ليست مناسبة بشكل جيد لالتقاط الهياكل الهندسية المحلية. لذلك، تقوم الطرق الرائدة بتعزيز بنية PointNet الأساسية بإضافة آليات مختلفة لالتقاط المعلومات السياقية المحلية، مثل شبكات التجميع الرسمية (graph convolutional networks) أو استخدام خصائص مصممة يدويًا.نقدم نهجًا بديلًا تحت اسم MinkLoc3D لحساب وصف سحابة نقطية ثلاثي الأبعاد تميز بين المواقع، وذلك بالاعتماد على تمثيل سحابة نقطية نادرة (sparse voxelized point cloud representation) والتحفيفات الثلاثية الأبعاد النادرة (sparse 3D convolutions). يتميز النهج المقترح ببنية بسيطة وكفوءة. وقد أثبتت التجارب على مقاييس معيارية أن MinkLoc3D يتفوق على أفضل الأساليب الحالية. الكود الخاص بنا متاح للعامة على موقع المشروع:https://github.com/jac99/MinkLoc3D