2 个月前
峰值引导的深度网络用于面部表情识别
Xiangyun Zhao; Xiaodan Liang; Luoqi Liu; Teng Li; Yugang Han; Nuno Vasconcelos; Shuicheng Yan

摘要
用于面部相关识别任务(如面部表情识别(FER))的深度网络训练目标函数通常独立考虑每个样本。在本研究中,我们提出了一种新颖的峰值引导深度网络(PPDN),该网络利用同一主体的峰值表情样本(易样本)来监督相同类型但非峰值表情样本(难样本)的中间特征响应。通过这种方式,从非峰值表情到峰值表情的演变过程可以隐式地嵌入网络中,以实现对表情强度的不变性。为了进行网络训练,我们提出了一种特殊目的的反向传播程序——峰值梯度抑制(PGS)。该方法促使非峰值表情样本在中间层的特征响应向对应的峰值表情样本靠拢,同时避免了相反的情况发生。这防止了由于非峰值表情样本的干扰而导致峰值表情样本识别能力下降的问题。在两个流行的FER数据集Oulu-CASIA和CK+上的广泛对比实验表明,PPDN优于现有的最先进的FER方法,并且展示了其在网络结构和优化策略方面的优势。此外,实验结果还证明了PPDN是一种通用架构,通过适当定义峰值和非峰值样本,可以扩展到其他任务。这一点在使用Multi-PIE数据集进行姿态不变人脸识别的任务中得到了验证,实验显示其性能达到了现有最先进水平。