
摘要
在本研究中,我们提出利用人类行为信息来改进单目视频中的姿态估计。为此,我们介绍了一种图像结构模型,该模型通过建模特定动作的外观模型和姿态先验,利用高层次的活动信息来纳入更高阶的部分依赖关系。然而,与使用额外昂贵的动作识别框架不同,我们的姿态估计框架能够高效地估算动作先验。这是通过从均匀的动作先验开始,并在姿态估计过程中更新动作先验来实现的。我们还展示了学习各动作类别之间适当的外观共享量可以提高姿态估计的效果。我们在两个具有挑战性的数据集上验证了所提方法的有效性,这些数据集包含超过80,000张测试图像,用于姿态估计和动作识别。