
摘要
点云配准是计算机视觉在机器人、医学影像等领域应用中的一个关键问题。该问题涉及找到一种刚性变换,将一个点云映射到另一个点云,使它们对齐。迭代最近点算法(Iterative Closest Point, ICP)及其变体为这一任务提供了简单且易于实现的迭代方法,但这些算法可能会收敛到虚假的局部最优解。为了应对ICP流程中的局部最优解及其他困难,我们提出了一种基于学习的方法,称为深度最近点(Deep Closest Point, DCP),该方法受到近期计算机视觉和自然语言处理技术的启发。我们的模型由三部分组成:点云嵌入网络、基于注意力机制的模块结合指针生成层以近似组合匹配,以及可微奇异值分解(Singular Value Decomposition, SVD)层以提取最终的刚性变换。我们在ModelNet40数据集上端到端地训练了我们的模型,并在多种设置下展示了其性能优于ICP、其变体(如Go-ICP、FGR)以及最近提出的基于学习的方法PointNetLK。除了提供最先进的配准技术外,我们还评估了所学特征在未见过的物体上的适用性。此外,我们对所学模型进行了初步分析,以帮助理解领域特定特征和/或全局特征是否有助于刚性配准。