2 个月前

CleanNet:用于大规模图像分类器训练的标签噪声迁移学习方法

Kuang-Huei Lee; Xiaodong He; Lei Zhang; Linjun Yang
CleanNet:用于大规模图像分类器训练的标签噪声迁移学习方法
摘要

本文研究了在标签噪声存在的情况下学习图像分类模型的问题。现有的依赖人工监督的方法通常不具备可扩展性,因为手动识别正确或错误的标签耗时较长;而不依赖人工监督的方法虽然具有可扩展性,但效果较差。为了减少标签噪声清理过程中所需的人工监督量,我们引入了CleanNet,一种联合神经嵌入网络,该网络仅需对部分类别进行人工验证即可提供标签噪声的知识,并将其迁移到其他类别中。我们进一步将CleanNet与传统的卷积神经网络分类器整合到一个框架中,用于图像分类的学习。我们在多个大规模数据集上展示了所提出的算法在标签噪声检测任务和基于噪声数据的图像分类任务中的有效性。实验结果表明,与当前的弱监督方法相比,CleanNet可以在没有人工监督的保留类别上将标签噪声检测错误率降低41.5%。此外,在图像分类任务中,仅验证3.2%的图像即可实现验证所有图像性能提升的47%。源代码和数据集将在kuanghuei.github.io/CleanNetProject网站上提供。