
摘要
人体姿态估计是动作识别的关键步骤。本文提出了一种从单张图像中估计三维人体姿态的方法,该方法与现有的二维姿态/关节检测器协同工作。三维姿态估计具有挑战性,因为多个三维姿态在投影后可能对应相同的二维姿态,这是由于缺乏深度信息所致。此外,当前的二维姿态估计器通常不够准确,可能会导致三维估计中的误差。我们通过三种方式应对这些挑战:(i) 将三维姿态表示为从三维人体骨架学习到的一组稀疏基的线性组合。(ii) 强制执行肢体长度约束以消除不符合人类形态的骨架。(iii) 通过最小化三维姿态投影与相应二维检测之间的$L_1$-范数误差来估计三维姿态。$L_1$-范数损失项对不准确的二维关节估计具有鲁棒性。我们使用交替方向法(Alternating Direction Method, ADM)高效地解决了优化问题。我们的方法在三个基准数据集上的表现优于现有最先进的技术。