
摘要
解决6D姿态估计问题并非易事,因为需要应对固有的外观和形状变化以及严重的物体间遮挡。在不受控环境下,由于外部光照条件的大幅变化和获取数据质量的低下,这一问题变得更加棘手。本文介绍了一种新颖的姿态估计算法W-PoseNet,该算法从输入数据密集回归到6D姿态,同时回归到模型空间中的3D坐标。换句话说,我们在深度网络中学习用于姿态回归的局部特征通过显式学习像素级对应映射至3D姿态敏感坐标作为辅助任务来加以正则化。此外,设计了稀疏像素对组合和像素对姿态预测的软投票机制以提高对不一致和稀疏局部特征的鲁棒性。实验结果表明,在流行的YCB-Video和LineMOD基准测试中,所提出的W-PoseNet算法始终优于现有的最先进算法。