
摘要
现有的3D人体姿态估计器在新数据集上的泛化性能较差,这主要是由于训练数据中2D-3D姿态对的多样性有限所致。为了解决这一问题,我们提出了PoseAug,这是一种新的自动增强框架,旨在通过增加训练姿态的多样性来提高训练后的2D到3D姿态估计器的泛化能力。具体而言,PoseAug引入了一种新颖的姿态增强器,该增强器通过可微操作学习调整姿态的各种几何因素(例如姿势、身体大小、视角和位置)。凭借这种可微能力,增强器可以与3D姿态估计器联合优化,并以估计误差作为反馈,在线生成更多样且更具挑战性的姿态。此外,PoseAug还引入了一种新的局部关节角度合理性评估方法——部分感知的动力链空间(Part-aware Kinematic Chain Space),并据此开发了一个判别模块,以确保增强后姿态的合理性。这些精心设计的功能使得PoseAug能够生成比现有离线增强方法更加多样且合理的姿态,从而提高了姿态估计器的泛化能力。PoseAug具有通用性和易于应用的特点,适用于各种3D姿态估计器。大量实验表明,PoseAug在同场景和跨场景数据集上均带来了显著的改进。特别是在跨数据集评估设置下,在MPI-INF-3DHP数据集上实现了88.6%的3D PCK指标,相比之前最佳的数据增强方法提升了9.1%。代码可在以下地址获取:https://github.com/jfzhang95/PoseAug。