
摘要
我们提出了一种在图神经网络(GNN)通用框架下用于三维点云处理的点表示与局部邻域图构建的简单但有效的改进方法。作为第一项贡献,我们提出在顶点表示中引入点的重要局部几何信息,并通过多层感知机(MLP)进行非线性映射,以增强特征表达能力。作为第二项贡献,我们针对三维点云的GNN图构建方法提出了改进。现有方法通常采用基于k近邻(k-NN)的策略构建局部邻域图,但我们指出,在场景中某些区域因传感器密集采样时,该方法可能导致邻域覆盖不足的问题。所提出的方案旨在缓解此类问题,提升在密集采样区域的覆盖性能。由于传统GNN设计用于处理一般图结构,其中顶点通常不具有几何语义,因此我们认为上述两项改进均是对通用图结构的增强,使其能够更好地体现三维点云的几何特性。尽管方法简洁,我们在多个具有挑战性的基准测试中进行了验证,涵盖较为干净的CAD模型以及真实世界中的噪声扫描数据。实验结果表明,所提方法在三维分类(ModelNet40)、部件分割(ShapeNet)和语义分割(Stanford 3D Indoor Scenes Dataset)等任务上均达到了当前最优性能。此外,我们还发现所提出的网络具有更快的训练收敛速度,分类任务中训练所需迭代次数减少约40%。项目详细信息可访问:https://siddharthsrivastava.github.io/publication/geomgcnn/