
摘要
单目头部姿态估计需要学习一个模型,该模型能够从输入的人脸图像中计算出姿态的内在欧拉角(偏航角、俯仰角、滚转角)。为野外环境中的图像标注真实的头部姿态角度是一项困难的任务,通常需要使用特定的拟合程序(这些程序只能提供粗略且近似的标注)。这突显了对能够在受控环境中训练并在野外图像上泛化的算法的需求(这些图像具有不同的面部外观和光照条件)。当前大多数直接在输入图像上学习回归函数的深度学习方法都无法实现这一目标。为此,我们提出使用更高层次的表示来通过深度学习架构回归头部姿态。具体而言,我们利用五个面部关键点(左耳、右耳、左眼、右眼和鼻子)上的二维软定位热图作为不确定性图,并将其传递给卷积神经网络以回归头部姿态。我们在两个具有挑战性的基准数据集BIWI和AFLW上展示了头部姿态估计的结果,我们的方法在这两个数据集上均超过了现有最先进的技术。