16 天前
一种面向超大规模人脸识别的高效训练方法
Kai Wang, Shuo Wang, Panpan Zhang, Zhipeng Zhou, Zheng Zhu, Xiaobo Wang, Xiaojiang Peng, Baigui Sun, Hao Li, Yang You

摘要
在深度学习时代,人脸识别技术得益于超大规模且标注完善的训练数据集,取得了显著进展。然而,在如此庞大的数据集上进行训练不仅耗时,还占用大量硬件资源。因此,设计一种高效的训练方法已成为必要。造成高计算与内存开销的主要原因在于全连接(Fully Connected, FC)层的维度高达百万级别。针对这一问题,本文提出一种新型训练方法——快速人脸分类(Faster Face Classification, F2C),在不牺牲性能的前提下,有效降低训练时间与资源消耗。该方法引入动态类别池(Dynamic Class Pool, DCP),用于动态存储与更新身份特征,可视为FC层的替代方案。由于DCP规模更小,且与全部人脸身份相互独立,因而具有显著的时间与成本优势。我们在多个公开的人脸识别基准数据集及私有数据集上对所提出的F2C方法进行了验证,结果表明其识别性能与当前最先进的FC-based方法相当,同时在识别准确率与硬件资源消耗方面均展现出更快的训练速度。此外,我们通过设计一种双通道数据加载器(dual data loader),包含基于身份(identity-based)与基于实例(instance-based)的加载机制,进一步提升了DCP参数更新的效率,显著增强了整体训练性能。