2 个月前

一种用于深度人脸表征的轻量级CNN模型及其在噪声标签下的应用

Wu, Xiang ; He, Ran ; Sun, Zhenan ; Tan, Tieniu
一种用于深度人脸表征的轻量级CNN模型及其在噪声标签下的应用
摘要

用于面部识别的卷积神经网络(CNN)模型的数量一直在不断增加,以更好地适应大量训练数据。当从互联网获取训练数据时,标签往往容易模糊且不准确。本文提出了一种轻量级CNN框架,旨在在大规模面部数据集上学习紧凑的嵌入表示,同时处理大量的噪声标签。首先,我们将一种maxout激活函数的变体——称为最大特征图(Max-Feature-Map, MFM)引入到CNN的每个卷积层中。与使用多个特征图来线性逼近任意凸激活函数的传统maxout激活不同,MFM通过竞争关系实现这一目标。MFM不仅能够分离噪声信号和有用信号,还能在两个特征图之间起到特征选择的作用。其次,我们精心设计了三个网络结构,以在提高性能的同时减少参数数量和计算成本。最后,提出了一种语义引导方法,使网络预测结果更加符合噪声标签。实验结果表明,所提出的框架能够利用大规模噪声数据学习一个计算成本和存储空间均高效的轻量级模型。该框架学习得到的单个网络,在256维表示下,在多个面部基准测试中取得了最先进的结果,并且无需微调。代码已发布在 https://github.com/AlfredXiangWu/LightCNN。