
摘要
传统检测器在处理长尾数据时性能会下降,因为它们存在对多数头部类别的分类偏差。本文认为,这种学习偏差源自两个因素:1)前景类别分布不平衡导致的竞争不平等;2)尾部类别样本多样性不足。为了解决这些问题,我们提出了一种称为平衡分类(BAlanced CLassification, BACL)的统一框架,该框架能够在同步的情况下自适应地纠正由类别分布差异引起的不平等,并动态增强样本多样性。具体而言,我们开发了一种新的前景分类平衡损失(Foreground Classification Balance Loss, FCBL),通过引入成对类别感知边界和自动调整权重项,分别缓解头部类别的主导地位并转移注意力到难以区分的类别上。这种损失函数可以防止在竞争不平等的情况下过度抑制尾部类别。此外,我们还提出了一种动态特征幻影模块(Dynamic Feature Hallucination Module, FHM),通过合成幻影样本来增强特征空间中尾部类别的表示,从而引入额外的数据变异性。在这种分而治之的方法中,BACL 在具有解耦训练管道的具有挑战性的 LVIS 基准测试中取得了新的最先进水平,总体和尾部类别的平均精度(Average Precision, AP)分别比普通的 Faster R-CNN with ResNet-50-FPN 提高了 5.8% 和 16.1%。大量实验表明,BACL 能够在不同数据集、不同骨干网络和架构下持续提升性能。代码和模型可在 https://github.com/Tianhao-Qi/BACL 获取。