
摘要
我们提出了一种名为分布平衡损失(Distribution-Balanced Loss)的新损失函数,用于解决具有长尾类别分布的多标签识别问题。相较于传统的单标签分类任务,多标签识别问题通常更具挑战性,主要源于两个关键问题:标签共现现象以及在将多标签问题转化为多个二分类任务时负标签的主导性。为应对上述挑战,分布平衡损失对标准的二元交叉熵损失进行了两项关键改进:1)提出一种新的权重重平衡机制,能够有效考虑标签共现带来的影响;2)引入负样本容忍正则化项,以缓解负标签被过度抑制的问题。在Pascal VOC和COCO数据集上的实验结果表明,采用该损失函数训练的模型在性能上显著优于现有方法。代码与预训练模型已开源,获取地址为:https://github.com/wutong16/DistributionBalancedLoss。