
摘要
由于类别间相似性高以及标注存在模糊性,带有噪声标签的面部表情识别(Noisy Label Facial Expression Recognition, FER)相较于传统的噪声标签分类任务更具挑战性。现有方法主要通过过滤高损失样本以应对该问题。本文从特征学习的新视角出发,探索噪声标签的处理方法。我们发现,FER模型在训练过程中会通过关注与噪声标签相关的一小部分特征来“记住”噪声样本,而非学习能够反映真实语义的完整特征表示。受此启发,我们提出一种新颖的擦除注意力一致性(Erasing Attention Consistency, EAC)方法,能够在训练过程中自动抑制噪声样本的影响。具体而言,我们首先利用人脸图像的翻转语义一致性,设计了一个不平衡的网络框架;随后,通过随机擦除输入图像,并结合翻转注意力一致性机制,防止模型过度关注局部特征。实验结果表明,EAC在多个噪声标签FER数据集上显著优于当前最先进的方法,并在类别数量较多的任务(如CIFAR100和Tiny-ImageNet)中展现出良好的泛化能力。代码已开源,地址为:https://github.com/zyh-uaiaaaa/Erasing-Attention-Consistency。