2 个月前
AdaptPose:通过可学习的动作生成实现3D人体姿态估计的跨数据集适应
Mohsen Gholami; Bastian Wandt; Helge Rhodin; Rabab Ward; Z. Jane Wang

摘要
本文探讨了三维人体姿态估计模型在跨数据集泛化中的问题。当在一个新的数据集上测试预训练的三维姿态估计器时,性能会显著下降。以往的方法主要通过提高训练数据的多样性来解决这一问题。我们认为,仅靠多样性是不够的,还需要调整训练数据的特征以适应新数据集的特点,如相机视角、位置、人类动作和身体尺寸。为此,我们提出了一种名为AdaptPose的端到端框架,该框架从源数据集中生成合成的三维人体运动,并利用这些合成运动对三维姿态估计器进行微调。AdaptPose采用对抗训练方案,从源三维姿态生成一系列三维姿态和一个用于将生成的姿态投影到新视图的相机方向。即使没有三维标签或相机信息,AdaptPose也能成功地从目标数据集中学习生成合成的三维姿态,而仅基于二维姿态进行训练。在Human3.6M、MPI-INF-3DHP、3DPW和Ski-Pose数据集上的实验表明,我们的方法在跨数据集评估中比以往的工作提高了14%,并且优于使用部分三维注释的半监督学习方法16%。