
摘要
卷积神经网络(CNN)在深度图像中的三维手部姿态估计任务中展现出良好的性能。与现有基于CNN的手部姿态估计方法仅以二维图像或三维体数据作为输入不同,本文提出的Hand PointNet直接处理建模手部可见表面的三维点云数据,用于姿态回归。通过将归一化后的点云作为输入,所提出的手部姿态回归网络能够有效捕捉复杂的手部结构,并准确回归出三维手部姿态的低维表示。为进一步提升指尖定位的精度,我们设计了一种指尖精修网络,该网络直接以估计指尖位置的邻近点为输入,对指尖位置进行精细化调整。在三个具有挑战性的手部姿态估计数据集上的实验结果表明,所提出的方法优于当前最先进的技术。