2 个月前

通过级联维度提升实现深度单目3D人体姿态估计

Zhang, Changgong ; Zhan, Fangneng ; Chang, Yuan
通过级联维度提升实现深度单目3D人体姿态估计
摘要

从单张图像中进行3D姿态估计是一个具有挑战性的问题,主要是由于深度的不确定性。以往的一种方法是利用外部2D姿态检测器获得的2D关节信息,将其提升到3D空间中。然而,这类方法忽略了图像中的上下文信息,而这些信息对于3D姿态估计是非常重要的线索。同时,还有一些其他方法直接从单目图像预测关节位置,但采用了2.5D输出表示 $P^{2.5D} = (u,v,z^{r})$,其中 $u$ 和 $v$ 在图像空间内,而 $z^{r}$ 在根节点相对的3D空间内。因此,通常需要利用地面真值信息(例如,相机到根节点关节的深度)将2.5D输出转换为3D空间,这在实际应用中限制了其适用性。在本研究中,我们提出了一种新颖的端到端框架,该框架不仅利用了上下文信息,还通过级联维度提升直接在3D空间中生成输出。具体来说,我们将从2D图像空间提升姿态到3D空间的任务分解为几个连续的子任务:1) 在2D空间中估计运动学骨架和各个关节的位置;2) 根节点相对深度的估计;以及3) 提升到3D空间。每个子任务都使用直接监督和上下文图像特征来指导学习过程。大量实验表明,所提出的框架在两个广泛使用的3D人体姿态数据集(Human3.6M 和 MuPoTS-3D)上达到了最先进的性能。

通过级联维度提升实现深度单目3D人体姿态估计 | 最新论文 | HyperAI超神经