
摘要
在自然场景下(in the wild)利用卷积神经网络(CNN)进行面部表情识别(Facial Expression Recognition, FER)是一项极具挑战性的任务,主要由于类内差异显著而类间相似性较高。为增强嵌入空间中学习特征的判别能力,许多FER方法采用深度度量学习(Deep Metric Learning, DML)策略,如中心损失(center loss)及其变体,并与Softmax损失联合优化。然而,对所有特征进行同等程度的度量学习监督,可能引入无关特征,从而削弱学习算法的泛化能力。为此,本文提出一种深度注意力中心损失(Deep Attentive Center Loss, DACL)方法,通过自适应选择最具判别性的特征子集,提升特征的区分能力。所提出的DACL方法引入注意力机制,利用CNN中间空间特征图作为上下文信息,估计与特征重要性相关联的注意力权重。这些估计权重被用于构建中心损失的稀疏化形式,从而在嵌入空间中实现对相关特征的类内紧凑性与类间分离性的选择性优化。在两个广泛使用的自然场景FER数据集上的大量实验表明,所提出的DACL方法在性能上优于当前最先进的方法,验证了其有效性与优越性。