
摘要
真实世界的数据分布本质上呈长尾分布,这对深度模型带来了巨大挑战。本文提出一种新方法——渐进式平衡损失与自适应特征生成器(Gradual Balanced Loss and Adaptive Feature Generator, GLAG),以缓解类别不平衡问题。GLAG首先通过渐进式平衡损失(Gradual Balanced Loss)学习一个平衡且鲁棒的特征表示模型;随后固定该特征模型,并利用表示良好的头部类别(head classes)所蕴含的知识,在特征层面增强表示不足的尾部类别(tail classes)。生成的合成样本在训练过程中与真实样本混合使用。渐进式平衡损失具有通用性,可与多种解耦训练方法结合,有效提升原始模型性能。在CIFAR100-LT、ImageNetLT和iNaturalist等长尾数据集上,GLAG均取得了当前最优(state-of-the-art)的识别效果,充分验证了其在长尾视觉识别任务中的有效性。