11 天前

LSK3DNet:面向高效且有效的稀疏大核3D感知

Tuo Feng, Wenguan Wang, Fan Ma, Yi Yang
LSK3DNet:面向高效且有效的稀疏大核3D感知
摘要

自主系统在计算资源受限的条件下,需处理大规模、稀疏且不规则的点云数据。因此,开发高效且有效的激光雷达(LiDAR)感知方法至关重要。尽管简单地扩大三维卷积核尺寸可提升性能,但会导致计算开销呈立方级增长,难以实际应用。为此,亟需设计结构精简的三维大卷积核架构,以消除冗余参数,并在保持大核优势的同时实现高效计算。本文提出一种高效且有效的大型稀疏卷积核三维神经网络(Large Sparse Kernel 3D Neural Network, LSK3DNet),通过动态剪枝机制实现三维卷积核的扩展。该方法包含两个核心组件:空间维度动态稀疏性(Spatial-wise Dynamic Sparsity, SDS)与通道维度权重选择(Channel-wise Weight Selection, CWS)。其中,SDS从训练初期即动态剪枝并重新生长体素化权重,以学习大尺度稀疏的三维卷积核。该策略不仅显著提升模型性能,同时大幅降低模型参数量与计算成本。此外,CWS在训练过程中选择对三维卷积最具贡献的通道,并在推理阶段剪除冗余通道,从而加速三维视觉任务的推理效率。我们在三个基准数据集及五个不同任务赛道上对LSK3DNet进行了全面评估,结果表明其性能显著优于经典模型及现有大核设计。尤为突出的是,在SemanticKITTI数据集上,LSK3DNet分别实现了单帧扫描75.6%和多帧扫描63.4%的领先分割精度,相较朴素的大尺寸三维卷积核模型,模型体积减少约40%,计算量降低约60%,充分验证了其在精度与效率之间的卓越平衡。

LSK3DNet:面向高效且有效的稀疏大核3D感知 | 最新论文 | HyperAI超神经