
摘要
我们提出了一种统一的3D人体姿态估计方法,该方法从单个原始RGB图像出发,同时考虑2D关节估计和3D姿态重建,以提高这两项任务的性能。我们采用了一种集成的方法,将3D人体姿态的概率知识与多阶段CNN架构相融合,并利用合理的3D地标位置知识来优化2D位置的搜索。整个过程经过端到端训练,具有极高的效率,并在Human3.6M数据集上取得了最先进的结果,其在2D和3D误差方面均优于先前的方法。
我们提出了一种统一的3D人体姿态估计方法,该方法从单个原始RGB图像出发,同时考虑2D关节估计和3D姿态重建,以提高这两项任务的性能。我们采用了一种集成的方法,将3D人体姿态的概率知识与多阶段CNN架构相融合,并利用合理的3D地标位置知识来优化2D位置的搜索。整个过程经过端到端训练,具有极高的效率,并在Human3.6M数据集上取得了最先进的结果,其在2D和3D误差方面均优于先前的方法。