摘要
本文提出一种多分辨率深度学习架构,用于对密集的大规模点云数据进行语义分割。密集点云数据在进行语义分割前需要经历计算成本较高的特征编码过程。以往的研究通过多种方式大幅下采样原始点云,以适应常规计算硬件的处理能力。尽管这些方法在一定程度上缓解了计算负担,但在处理多帧扫描数据时仍存在能力局限。为此,本文提出MuGNet——一种内存高效、端到端的图神经网络框架,用于大规模点云的语义分割。该框架通过在预构建的点云图上应用图神经网络,显著降低计算需求,并结合双向网络结构,融合多分辨率下的特征嵌入,从而在保持分割精度的同时提升效率。所提出的框架已在Stanford Large-Scale 3D Indoor Spaces Dataset(S3DIS)和Virtual KITTI等基准数据集上得到验证。实验结果表明,该框架可在单张11 GB显存的GPU上同时处理高达45个房间扫描数据,且在S3DIS数据集上的整体准确率达到88.5%(提升3%),平均交并比(mIOU)达69.8%(提升7.7%),显著优于现有基于图神经网络的分割方法。