HyperAIHyperAI
منذ 11 أيام

SqueezeSegV3: ت convolution متعددة المساحات للتقسيم الفعّال للسحابة النقطية

Chenfeng Xu, Bichen Wu, Zining Wang, Wei Zhan, Peter Vajda, Kurt Keutzer, Masayoshi Tomizuka
SqueezeSegV3: ت convolution متعددة المساحات للتقسيم الفعّال للسحابة النقطية
الملخص

تُعد تقسيم سحابات النقاط باستخدام تقنية LiDAR مشكلة مهمة لعدد كبير من التطبيقات. بالنسبة لتقسيم سحابات النقاط على نطاق واسع، فإن الطريقة الشائعة حاليًا هي تحويل سحابة النقاط ثلاثية الأبعاد إلى صورة ثنائية الأبعاد باستخدام مستشعر LiDAR، ثم استخدام التحويلات التلافيفية (convolutions) لمعالجتها. وعلى الرغم من التشابه بين الصور RGB المنتظمة والصور التي تُنتج من مستشعرات LiDAR، فإننا نكتشف أن توزيع الميزات في الصور التي تُنتج من LiDAR يتغير بشكل كبير حسب الموقع داخل الصورة. ويُعد استخدام التحويلات التلافيفية القياسية لمعالجة هذه الصور مشكلة، لأن مرشحات التلافيف تُستَخدم لاستخلاص ميزات محلية تكون نشطة فقط في مناطق محددة داخل الصورة. وبسبب ذلك، يُستخدم جزء من القدرة الحسابية للشبكة بشكل غير كافٍ، مما يؤدي إلى تراجع أداء التقسيم. ولحل هذه المشكلة، نقترح تقنية التلافيف المتكيف مكانيًا (Spatially-Adaptive Convolution - SAC)، التي تُطبّق مرشحات مختلفة حسب الموقع داخل الصورة بناءً على المدخلات. وتُعد SAC قابلة للحساب بكفاءة، حيث يمكن تنفيذها من خلال سلسلة من العمليات الحسابية مثل الضرب الطرفي (element-wise multiplication)، وتحويل المصفوفات إلى أعمدة (im2col)، والتحويلات التلافيفية القياسية. وتمثّل SAC إطارًا عامًا، بحيث يمكن اعتبار عدة طرق سابقة حالات خاصة ضمن هذا الإطار. وباستخدام SAC، نُنشئ نموذج SqueezeSegV3 لتقسيم سحابات النقاط من LiDAR، ونُفوق جميع الطرق المنشورة سابقًا بنسبة لا تقل عن 3.7% في مقياس mIoU على معيار SemanticKITTI، مع الحفاظ على سرعة استنتاج مقارنة بالطرق الأخرى.

SqueezeSegV3: ت convolution متعددة المساحات للتقسيم الفعّال للسحابة النقطية | أحدث الأوراق البحثية | HyperAI