
摘要
近年来,三维激光雷达(3D LiDAR)点云数据的可用性显著提升,但数据标注仍面临成本高昂且耗时的问题,从而催生了对半监督语义分割方法的迫切需求,尤其在自动驾驶等应用领域。现有方法通常采用结构较大的分割主干网络以提升分割精度,但由此带来了较高的计算开销。此外,许多方法采用均匀采样策略以减少对真实标注数据的需求,却常常导致性能不佳。针对上述问题,本文提出一种新型处理流程,采用更轻量级的网络架构,在显著减少所需真实标注数据量的同时,实现了优于当前主流方法的分割精度。这一优势得益于我们提出的新型稀疏深度可分离卷积模块(Sparse Depthwise Separable Convolution),该模块在大幅降低网络参数量的同时,有效保持了整体任务性能。为实现高效的数据子采样,我们进一步提出一种时空冗余帧下采样方法(Spatio-Temporal Redundant Frame Downsampling, ST-RFD),该方法利用传感器在环境中的运动信息,提取更具多样性的训练帧子集,从而提升训练数据的有效性。为更充分地利用有限的标注样本,我们还引入一种基于LiDAR反射率信息的软伪标签(soft pseudo-label)策略。实验结果表明,在SemanticKITTI(59.5@5%)和ScribbleKITTI(58.1@5%)两个基准数据集上,本方法在仅使用较少标注数据的情况下,mIoU指标超越了当前主流的半监督方法。同时,模型参数量减少了2.3倍,乘加操作(multiply-add operations)减少了641倍,且在极小规模训练数据下仍展现出显著的性能提升,充分验证了“少即是多”(Less is More)的设计理念。