11 天前
多标签分类中的非对称损失
Emanuel Ben-Baruch, Tal Ridnik, Nadav Zamir, Asaf Noy, Itamar Friedman, Matan Protter, Lihi Zelnik-Manor

摘要
在典型的多标签学习场景中,一张图像平均仅包含少量正标签,而负标签数量则远多于正标签。这种正负样本的不平衡性主导了优化过程,导致在训练过程中对正标签的梯度关注不足,从而影响模型的准确率。本文提出一种新颖的非对称损失函数(ASL),该函数对正样本与负样本采用不同的处理机制。ASL能够动态地降低简单负样本的权重,并对其施加硬阈值处理,同时还能有效剔除可能存在误标注的样本。我们展示了ASL如何实现不同样本概率的均衡化,以及这种均衡性如何转化为更高的mAP(平均精度均值)表现。在多个主流多标签数据集上,包括MS-COCO、Pascal-VOC、NUS-WIDE和Open Images,ASL均取得了当前最优的性能。此外,我们还验证了ASL在其他任务中的适用性,如单标签分类与目标检测。ASL具有高效性、实现简便,且不增加训练时间或计算复杂度。代码实现已开源,地址为:https://github.com/Alibaba-MIIL/ASL。