
摘要
学习带有噪声标签(Learning with Noisy Labels, LNL)的目标是在标签被污染的训练集上仍能保证模型的泛化能力。本文研究了一种较少被关注的LNL场景——细粒度数据集上的LNL(LNL-FG),该场景更具实际意义且挑战性更高,因为细粒度类别之间存在较大的类间模糊性,导致噪声标签更为普遍。我们通过实验表明,现有在标准LNL任务中表现良好的方法在LNL-FG任务上难以取得令人满意的效果,凸显了针对LNL-FG设计有效解决方案的迫切需求。为此,本文提出一种新型框架——随机噪声容错监督对比学习(Stochastic Noise-tolerated Supervised Contrastive Learning, SNSCL),通过促进可区分的特征表示来应对标签噪声。具体而言,我们设计了一种噪声容错的监督对比学习损失函数,引入一种基于权重感知的机制,用于噪声标签修正,并选择性地更新动量队列(momentum queue)中的样本。该机制有效缓解了噪声锚点(noisy anchors)带来的负面影响,同时避免将噪声标签引入动量更新的队列中。此外,为避免在对比学习中依赖人工设计的数据增强策略,我们进一步提出一种高效的随机模块,该模块从生成的分布中采样特征嵌入,不仅提升了模型的表示能力,还增强了方法的自动化与适应性。SNSCL具有良好的通用性,可与当前主流的鲁棒LNL方法兼容,显著提升其在LNL-FG任务中的性能表现。大量实验结果验证了SNSCL的有效性与优越性,表明其在处理细粒度数据中的标签噪声问题上具有重要的应用价值。