
摘要
基于余弦的softmax损失及其变体在深度学习面部识别中取得了巨大成功。然而,这些损失函数中的超参数设置对优化路径及最终识别性能有着显著影响。手动调整这些超参数高度依赖于用户经验,并需要许多训练技巧。本文深入研究了基于余弦的softmax损失中两个重要超参数——尺度参数和角度裕度参数——的影响,通过分析它们如何调节预测分类概率来探讨其作用机制。基于这些分析,我们提出了一种新的无超参数的基于余弦的softmax损失函数AdaCos,该方法利用自适应尺度参数在训练过程中自动增强训练监督。我们将提出的AdaCos损失应用于大规模面部验证和识别数据集,包括LFW、MegaFace和IJB-C 1:1 验证数据集。实验结果表明,使用AdaCos损失训练深度神经网络具有稳定性,并能实现高精度的面部识别。我们的方法在这三个数据集上的表现均优于当前最先进的softmax损失函数。