
摘要
从单张图像中进行三维人体姿态估计是一个逆问题,因为深度信息的缺失导致了固有的模糊性。以往的一些研究通过生成多个假设来解决这一逆问题。然而,这些方法通常需要强监督,并且需要真实的二维到三维对应关系,这在实际应用中可能难以获得。本文提出了一种弱监督的深度生成网络,以解决逆问题并避免对真实二维到三维对应关系的需求。为此,我们设计了该网络来建模一个提议分布,用以近似未知的多模态目标后验分布。我们通过最小化提议分布与目标分布之间的KL散度来实现这一近似,从而得到可以进行弱监督的二维重投影误差和先验损失项。此外,我们利用均值漂移算法确定最可能的解作为样本条件模式。我们在三个基准数据集——Human3.6M、MPII和MPI-INF-3DHP上评估了我们的方法。实验结果表明,我们的方法能够生成多个可行的假设,并且在现有的弱监督方法中达到了最先进的性能。我们的源代码可在项目网站上获取。