17 天前

针对标签污染的增强型元标签修正方法

Mitchell Keren Taraday, Chaim Baskin
针对标签污染的增强型元标签修正方法
摘要

传统学习方法在处理带噪声标签的数据集时,虽能有效应对人为注入噪声的场景,但在应对现实世界中的噪声数据方面仍存在明显不足。随着元学习在机器学习多个领域的广泛应用,研究者们开始利用辅助的小规模干净数据集对训练标签进行元校正。然而,现有的元标签校正方法尚未充分发挥其潜力。在本研究中,我们提出了一种增强型元标签校正方法(Enhanced Meta Label Correction,简称 EMLC),用于解决带噪声标签的学习(Learning with Noisy Labels, LNL)问题。我们重新审视了元学习过程,提出了更快速且更精确的元梯度推导机制,并设计了一种专为LNL问题量身定制的新型教师网络架构,同时引入了创新的训练目标。实验结果表明,EMLC在所有标准基准测试中均显著优于现有方法,达到了当前最优性能。特别地,在真实世界噪声数据集Clothing1M上,EMLC相较于先前最优方法提升了1.52%的准确率,同时每轮训练时间仅为基线方法的50%,且元目标函数的收敛速度也大幅加快。