
摘要
在本文中,我们提出了一种从静态图像进行人体姿态估计的端到端可训练回归方法。我们使用所提出的Soft-argmax函数直接将特征图转换为关节坐标,从而构建了一个完全可微分的框架。我们的方法能够间接学习热图表示,而无需额外的人工生成真实标签的步骤。因此,上下文信息可以无缝地融入姿态预测中。我们在两个极具挑战性的数据集上评估了该方法,即利兹体育姿态(Leeds Sports Poses, LSP)数据集和MPII人体姿态数据集,结果表明该方法在所有现有的回归方法中表现最佳,并且与基于检测的最先进方法的结果相当。