التحليل التصنيفي لليدار من منظور 360 درجة باستخدام كاميرا واحدة: نهج قائم على عدد قليل من الأمثلة

تُعاني تطبيقات التعلم العميق على بيانات LiDAR من فجوة مجالية قوية عند تطبيقها على أجهزة استشعار مختلفة أو مهام متعددة. ولتمكين هذه الطرق من تحقيق دقة مماثلة على بيانات مختلفة مقارنة بالقيم المُعلَنة في المعايير العامة، يُعدّ وجود مجموعة بيانات مُعلَّمة على نطاق واسع أمرًا ضروريًا. ومع ذلك، فإن البيانات المُعلَّمة في التطبيقات العملية تكون مكلفة وطويلة الأمد في الحصول عليها. وقد أدى هذا إلى توليد أبحاث متعددة في مجال الطرق الفعّالة من حيث عدد العلامات، لكن ما يزال هناك فجوة كبيرة بينها وبين النماذج المُدرَّبة بالكامل. ولذلك، نقترح "ImageTo360"، منهجًا فعّالًا ومبسّطًا للتعلم بكمية قليلة من العينات (few-shot) بهدف التحسين في كفاءة العلامات لتحليل LiDAR. تعتمد طريقة عملنا على شبكة تعليمية (teacher) مبنية على الصور لتقديم تنبؤات دلالية على بيانات LiDAR ضمن منظور كاميرا واحد. وتُستخدم هذه الشبكة التعليمية لتدريب مسبّق للشبكة الطالبة (student) المُخصصة لتحليل LiDAR، قبل التحسين الدقيق (fine-tuning) الإضافي على بيانات 360°. وتُطبَّق طريقة العمل لدينا بطريقة معيارية على مستوى النقط (point level)، مما يجعلها قابلة للتطبيق على معمليات معمارية مختلفة. ونُحقِّق تحسينًا على أفضل النتائج المُحقَّقة حاليًا في مجال الطرق الفعّالة من حيث عدد العلامات، بل ونتجاوز بعض الشبكات التقليدية المُدرَّبة بالكامل لتحليل التصنيف.