摘要
视线估计是理解人类视觉注意力的重要任务。尽管近年来算法的不断进步带来了性能提升,但由于头部姿态变化和光照不均匀导致的双眼外观不对称,该任务依然面临挑战。本文提出一种新型网络架构——代理引导视线估计网络(Agent-guided Gaze Estimation Network, AGE-Net),以充分且高效地利用双眼特征。通过分析双眼外观不对称性及其引发的特征空间不对称性,我们设计了一个主干分支与两个代理回归任务。主干分支从低层语义中提取左右眼的相关特征;同时,代理回归任务从高层语义中提取左右眼的非对称特征,用以引导主干分支更深入地学习眼区特征空间。实验结果表明,所提方法在MPIIGaze和EyeDiap两个数据集上均达到了当前最优的视线估计性能。