
摘要
从单目图像中进行三维人体姿态估计是一个高度病态的问题,由于深度模糊性和遮挡的存在。然而,大多数现有研究忽略了这些模糊性,仅估计单一解。相比之下,我们生成了一组多样化的假设,代表了可行的三维姿态的完整后验分布。为此,我们提出了一种基于归一化流的方法,该方法利用确定性的三维到二维映射来解决模糊的逆二维到三维问题。此外,通过将二维检测器的不确定性信息作为条件纳入模型,有效地建模了不确定检测和遮挡问题。成功的关键因素还包括学习到的三维姿态先验以及最佳M损失函数的泛化。我们在两个基准数据集Human3.6M和MPI-INF-3DHP上评估了我们的方法,在大多数指标上均优于所有可比方法。该实现代码已在GitHub上公开发布。