
摘要
我们对刚性物体的姿态估计问题进行了表征,将其定义为确定视角以解释粗略姿态,并通过关键点预测来捕捉更精细的细节。我们在两种不同的场景下解决了这两个任务——一种是有已知边界框的约束场景,另一种是更具挑战性的检测场景,在这种场景中目标是同时检测并准确估计物体的姿态。我们提出了基于卷积神经网络的架构来完成这些任务,并证明了利用视角估计可以显著提高基于局部外观的关键点预测效果。除了在上述任务中取得了显著优于现有最佳方法的成果外,我们还分析了错误模式以及物体特性对性能的影响,以指导未来在这方面的工作。