
摘要
深度神经网络在训练数据呈现长尾分布时,常因多数类占据主导地位而导致性能下降,进而产生偏差模型。尽管近期研究通过从数据空间中获取优良表征来缓解该问题,但鲜有工作关注特征范数对预测结果的影响。为此,本文从特征空间的角度出发,提出一种特征平衡损失(feature-balanced loss)。具体而言,我们通过给予尾部类别相对更强的激励,促使它们的特征范数增大;同时,激励强度采用课程学习(curriculum learning)的方式逐步增强,从而在提升尾部类别泛化能力的同时,保持头部类别的性能表现。在多个主流长尾识别基准上的大量实验表明,所提出的特征平衡损失在性能上显著优于现有最先进方法。