
摘要
本文提出了一种从单张图像中进行头部姿态估计的方法。以往的方法通常依赖于关键点或深度估计来预测头部姿态,往往需要过多的计算资源。本文方法基于回归与特征聚合,采用软阶段性回归(soft stagewise regression)策略,以构建紧凑的模型结构。现有特征聚合方法将输入视为特征的“集合”,忽略了特征图中特征之间的空间关系。为此,本文提出在特征聚合前学习一种细粒度的结构映射,以实现空间上的特征分组。该细粒度结构能够提供基于部件的信息以及聚合后的统计值。通过在空间位置上引入可学习与不可学习的重要性权重,可生成多种模型变体,并形成互补的集成结构。实验结果表明,本方法在性能上优于当前最先进的方法,包括无关键点(landmark-free)方法以及基于关键点或深度估计的方法。仅需单帧RGB图像作为输入,本方法在估计偏航角(yaw angle)方面,甚至超越了利用多模态信息(如RGB-D、RGB-Time)的方法。此外,本方法的内存开销仅为先前方法的1/100,显著降低了资源消耗。