摘要
近年来,面部表情识别(Facial Expression Recognition, FER)在计算机视觉研究领域受到广泛关注。本文提出一种名为双方向注意力混合特征网络(Dual-Direction Attention Mixed Feature Network, DDAMFN)的创新网络架构,专为FER任务设计,兼具优异的鲁棒性与轻量化特性。该网络架构由两个核心组件构成:作为主干网络的混合特征网络(Mixed Feature Network, MFN)以及作为头部结构的双方向注意力网络(Dual-Direction Attention Network, DDAN)。为增强MFN的特征提取能力,采用多尺寸卷积核以提取更具韧性的特征表示。同时,本文提出一种新型双方向注意力(Dual-Direction Attention, DDA)机制,能够生成两个方向的注意力图,从而有效捕捉面部表情中的长程依赖关系。为进一步提升模型精度,本文还设计了一种新颖的注意力损失机制,使不同注意力头能够聚焦于输入图像的不同区域,实现更精细的特征关注。在多个广泛使用的公开数据集(包括AffectNet、RAF-DB和FERPlus)上的实验结果表明,DDAMFN在性能上显著优于现有主流模型,充分验证了其在面部表情识别领域的先进性,确立了其作为当前该领域最先进模型的地位。