摘要
在野外环境下的面部表情识别(Facial Expression Recognition, FER)受到广泛关注,其中遮挡和姿态变化是两个关键挑战。本文提出了一种全局多尺度与局部注意力网络(MA-Net),用于提升野外环境下的面部表情识别性能。该网络主要由三个核心模块构成:特征预提取器、多尺度特征融合模块和局部注意力模块。特征预提取器用于提取中间层次的特征;多尺度特征融合模块通过融合具有不同感受野的特征,降低深层卷积网络对遮挡和姿态变化的敏感性;局部注意力模块则引导网络聚焦于局部显著特征,有效缓解遮挡及非正面姿态对野外表情识别带来的干扰。大量实验结果表明,所提出的MA-Net在多个野外表情识别基准数据集上均取得了当前最优的性能表现:在CAER-S、AffectNet-7、AffectNet-8、RAFDB和SFEW数据集上的准确率分别达到88.42%、64.53%、60.29%、88.40%和59.40%。