
摘要
可用于表情识别研究的数据集相对较小,这使得训练深度网络进行表情识别变得非常具有挑战性。尽管微调可以在一定程度上缓解这一问题,但由于从预训练域中提取的深层特征可能包含冗余信息,性能仍然低于可接受水平。在本文中,我们提出了FaceNet2ExpNet,这是一种基于静态图像训练表情识别网络的新方法。首先,我们提出了一种新的分布函数来建模表情网络的高层神经元。在此基础上,精心设计了一个两阶段训练算法。在预训练阶段,我们通过人脸网络正则化来训练表情网络的卷积层;在精炼阶段,我们在预训练的卷积层之后添加全连接层,并联合训练整个网络。可视化结果显示,使用我们的方法训练的模型能够捕捉到更高层次的表情语义信息。在四个公开的表情数据库(CK+、Oulu-CASIA、TFD 和 SFEW)上的评估表明,我们的方法优于现有最先进方法。