
摘要
三维人体姿态估计是人工智能领域的一个基础性问题,在增强现实/虚拟现实(AR/VR)、人机交互(HCI)以及机器人技术等领域具有广泛的应用前景。然而,现有的基于点云的三维人体姿态估计方法仍面临噪声点干扰以及估计结果抖动等问题,这主要源于传统手工设计的点云采样策略以及单帧独立估计的范式。本文从点云序列的角度提出了一种全新的三维人体姿态估计方法。为从输入点云中有效采样关键点,我们设计了一种基于密度引导注意力机制的可微分点云采样方法;为抑制以往方法中常见的姿态抖动问题,我们引入时序信息以增强估计的稳定性。在ITOP数据集和NTU-RGBD数据集上的实验结果表明,本文提出的各项组件均具有显著有效性,所提方法在多个评价指标上达到了当前最优(state-of-the-art)性能。