
摘要
本文提出了一种基于学习的方法,用于计算用于位置识别的判别性3D点云描述符。现有的方法,如PointNetVLAD,基于无序的点云表示。它们使用PointNet作为第一步来提取局部特征,这些特征随后被聚合为全局描述符。然而,PointNet架构在捕捉局部几何结构方面并不十分合适。因此,最先进的方法通过添加不同的机制来增强基础的PointNet架构,以捕获局部上下文信息,例如图卷积网络或使用手工设计的特征。我们提出了一种替代方法,称为MinkLoc3D,该方法基于稀疏体素化的点云表示和稀疏3D卷积来计算判别性3D点云描述符。所提出的方法具有简单且高效的架构。在标准基准上的评估证明了MinkLoc3D优于当前最先进的方法。我们的代码已在项目网站上公开提供:https://github.com/jac99/MinkLoc3D