
摘要
本文介绍了一种新颖的深度学习方法,用于从RGB图像中进行三维物体检测和六自由度(6D)姿态估计。我们提出的方法称为DPOD(密集姿态物体检测器),该方法估计输入图像与可用三维模型之间的密集多类别二维-三维对应图。通过PnP和RANSAC算法,根据这些对应关系计算出六自由度的姿态。此外,我们使用一种自定义的基于深度学习的姿态细化方案对初始姿态估计进行RGB图像上的进一步优化。我们的实验结果和与大量相关工作的对比表明,大量的对应关系在姿态细化前后都有助于获得高质量的六自由度姿态。与其他主要使用真实数据进行训练且不使用合成渲染数据的方法不同,我们在合成和真实训练数据上进行了评估,结果显示在姿态细化前后均优于所有近期的检测器。尽管该方法具有较高的精度,但仍具备实时处理能力。