摘要
多人三维姿态估计是一项具有挑战性的任务,主要由于人体在尺度和姿态上存在巨大差异,运动速度快,场景中存在多人,以及因遮挡或截断导致可见身体部位数量不固定等因素。部分不确定性可通过使用多视角图像得以缓解,因为多视角能够提供更丰富的身体部位证据。本文提出一种基于多视角图像中证据的多人三维姿态估计新方法。该方法采用一种全连接的成对条件随机场(pairwise conditional random field),其中包含两类成对项:第一类成对项基于人体关节的刚性结构配置,编码人体关节之间的空间依赖关系;第二类成对项则基于二维深度部件检测器的输出结果。随后,利用循环信念传播(loopy belief propagation)算法进行近似推理。所提出的方法在Campus、Shelf、Utrecht多人运动基准数据集、Human3.6M、KTH Football II以及MPII Cooking等多个公开数据集上进行了评估。实验结果表明,该方法在正确姿态概率(probability of correct pose)和每关节平均定位误差(mean per joint position error)两项关键指标上,均显著优于现有的最先进方法。