11 天前
基于图结构的多视角图像三维多人姿态估计
Size Wu, Sheng Jin, Wentao Liu, Lei Bai, Chen Qian, Dong Liu, Wanli Ouyang

摘要
本文研究了从多个标定相机视角中估计多人三维人体姿态的任务。遵循自顶向下的范式,我们将该任务分解为两个阶段:人体定位与姿态估计,两个阶段均采用由粗到精的处理方式。为此,我们提出了三种针对特定任务的图神经网络,以实现高效的特征信息传递。在三维人体定位阶段,首先利用多视角匹配图模块(Multi-view Matching Graph Module, MMG)学习跨视角关联,恢复初步的人体候选区域;随后,中心精修图模块(Center Refinement Graph Module, CRG)通过灵活的基于点的预测进一步优化定位结果。在三维姿态估计阶段,姿态回归图模块(Pose Regression Graph Module, PRG)同时学习多视角几何关系以及人体关节间的结构关联。所提出的方法在CMU Panoptic和Shelf数据集上均取得了当前最优的性能表现,且计算复杂度显著降低。