
摘要
尽管近期在点云配准中引入学习机制已取得显著进展,但多数方法仍聚焦于学习特征描述子,并依赖最近邻特征匹配与RANSAC进行异常值剔除,以获取最终的对应点集用于位姿估计。在本工作中,我们提出假设:注意力机制可替代显式的特征匹配与RANSAC过程,因此设计了一种端到端框架,直接预测最终的对应点集。该框架采用以Transformer层为主导的网络结构,包含自注意力与交叉注意力机制,训练目标为预测每个点位于两片点云重叠区域的概率及其在另一点云中的对应位置。由此得到的预测对应关系可直接用于估计刚性变换,无需后续后处理。尽管方法结构简洁,我们的模型在3DMatch与ModelNet基准测试中均达到了当前最优性能。项目源代码可于 https://github.com/yewzijian/RegTR 获取。