11 天前

一种数据驱动的方法以提升3D头姿估计性能

{Eraldo Ribeiro, Nima Aghli}
摘要

从图像中进行头部姿态估计是计算机视觉领域的重要研究课题,其应用广泛,涵盖注意力焦点检测、驾驶员行为追踪以及人机交互等多个方面。近年来,头部姿态估计的研究主要集中在基于深度卷积神经网络(CNN)的模型开发上。这些模型通过迁移学习(transfer learning)与图像增强技术进行训练,以获得更优的初始化状态,并提升对遮挡情况的鲁棒性。然而,现有的迁移学习方法通常针对通用图像识别任务设计,缺乏对从更任务相关网络(如人脸相关任务)中进行迁移学习的深入研究。此外,对于头部姿态估计而言,模型在面对严重遮挡、运动模糊及低亮度等噪声干扰时的鲁棒性至关重要。本文提出一种新型图像增强方法,显著提升了头部姿态估计模型的精度;同时,我们引入了一种面向任务的权重初始化策略,通过分析人脸识别等面部相关任务训练所得模型的内部激活特性,进一步优化了估计性能。我们在三个具有挑战性的测试集上对所提出的头部姿态估计模型进行了评估,结果优于当前最先进的方法。

一种数据驱动的方法以提升3D头姿估计性能 | 最新论文 | HyperAI超神经