LMSCNet: شبكة خفيفة الوزن متعددة المقياس لإكمال الدلالة ثلاثية الأبعاد

نقدم نهجًا جديدًا لإكمال المشهد الثلاثي الأبعاد بمعناه من المسح الضوئي ثلاثي الأبعاد المُجزأ (voxelized) والخشن (sparse). على عكس ما ورد في الأدبيات، نستخدم هيكل 2D UNet مع اتصالات تخطية شاملة متعددة القياسات لتعزيز تدفق الخصائص، بالإضافة إلى رؤوس تقسيم ثلاثية الأبعاد. في معيار SemanticKITTI، يحقق طرحنا أداءً مكافئًا في إكمال المعنى وأداءً أفضل في إكمال الاشغال مقارنة بكافة الأساليب المنشورة الأخرى - مع كونه أخف وزنًا وأسرع بشكل كبير. وبالتالي، يوفر هذا النهج توازنًا رائعًا بين الأداء والسرعة للتطبيقات الروبوتية المتحركة. تظهر دراسات التحليل الحذفي أن طرحنا مقاوم للمدخلات ذات الكثافة المنخفضة، وأنه يمكنه تحقيق سرعة عالية جدًا لإكمال المعنى على المستوى الأكثر خشونة. يمكن الوصول إلى شفرتنا البرمجية عبر الرابط:https://github.com/cv-rits/LMSCNet.