HyperAIHyperAI
منذ 3 أشهر

الاستخلاص المعرفي من النقطة إلى المكعب للتقسيم الدلالي لليدار

Yuenan Hou, Xinge Zhu, Yuexin Ma, Chen Change Loy, Yikang Li
الاستخلاص المعرفي من النقطة إلى المكعب للتقسيم الدلالي لليدار
الملخص

يتناول هذا المقال مشكلة استخلاص المعرفة من نموذج معلم كبير إلى شبكة طالب رفيعة لتصنيف معنى LiDAR. يؤدي استخدام الطرق السابقة للاستخلاص بشكل مباشر إلى نتائج أقل جودة ناتجة عن التحديات الجوهرية لسحوبات النقاط، مثل الندرة، العشوائية، والتغير في الكثافة. ولحل هذه المشكلات، نقترح طريقة استخلاص المعرفة من نقطة إلى مكعب (PVD)، التي تقوم بنقل المعرفة الخفية من كل من مستوى النقطة ومستوى المكعب. بشكل محدد، نستخدم في البداية استخلاص الناتج على مستوى النقطة وعلى مستوى المكعب لتعزيز إشارات التدريب المحدودة. ثم، للاستفادة الأفضل من المعلومات الهيكلية، نقسم السحابة الكاملة للنقاط إلى عدة مكعبات رقابية (supervoxels)، ونصمم استراتيجية عينة مبنية على درجة الصعوبة، بحيث تُستخرج المكعبات التي تحتوي على فئات نادرة أو كائنات بعيدة بشكل متكرر. على هذه المكعبات، نقترح استخلاصًا للتشابه بين النقط (inter-point) وبين المكعبات (inter-voxel)، حيث يمكن لمعلومات التشابه بين النقط والمكعبات مساعدة نموذج الطالب على استيعاب المعلومات الهيكلية للبيئة المحيطة بشكل أفضل. أجرينا تجارب واسعة على معيارين شهيرين لتصنيف LiDAR، وهما nuScenes وSemanticKITTI. على كلا المعيارين، تفوقت طريقة PVD بشكل متسق على الطرق السابقة للاستخلاص بفارق كبير، على ثلاثة نماذج أساسية ممثلة، وهي Cylinder3D وSPVNAS وMinkowskiNet. وبشكل ملحوظ، على مجموعتي بيانات الصعبة nuScenes وSemanticKITTI، تُحقّق طريقتنا تقريبًا خفضًا بنسبة 75% في عدد العمليات الحسابية المضاعفة (MACs) وزيادة في السرعة بمقدار 2 مرة بالنسبة لنموذج Cylinder3D التنافسي، كما نالت المركز الأول في قائمة التصنيف لـ SemanticKITTI بين جميع الخوارزميات المنشورة. يمكن الوصول إلى الكود الخاص بنا عبر الرابط: https://github.com/cardwing/Codes-for-PVKD.