13 天前

基于类别感知选择性损失的局部标注多标签分类

Emanuel Ben-Baruch, Tal Ridnik, Itamar Friedman, Avi Ben-Cohen, Nadav Zamir, Asaf Noy, Lihi Zelnik-Manor
基于类别感知选择性损失的局部标注多标签分类
摘要

大规模多标签分类数据集通常且不可避免地存在部分标注问题,即每个样本仅标注了少量标签。不同的缺失标签处理方法会赋予模型不同的特性,并显著影响其分类准确率。本文针对这一部分标注问题展开分析,并提出一种基于两个核心思想的解决方案。首先,对于未标注的标签,应根据两个概率量进行选择性处理:一是整个数据集中各类别的整体分布,二是特定样本对某一标签的预测可能性。我们提出利用一个专用的临时模型来估计类别分布,并证明该方法相较于仅依赖数据集部分标注信息进行的朴素估计,具有更高的效率与准确性。其次,在目标模型的训练过程中,我们引入一种专门设计的非对称损失函数,以强化已标注标签的贡献,同时弱化原始未标注标签的影响,从而提升模型对真实标签的识别能力。基于上述新方法,我们在 OpenImages 数据集上取得了当前最优的性能表现(例如在 V6 版本上达到 87.3 mAP)。此外,在 LVIS 和模拟 COCO 数据集上的实验进一步验证了该方法的有效性。相关代码已开源,地址为:https://github.com/Alibaba-MIIL/PartialLabelingCSL。