2 个月前
为伪标签辩护:一种面向不确定性的伪标签选择框架用于半监督学习
Mamshad Nayeem Rizve; Kevin Duarte; Yogesh S Rawat; Mubarak Shah

摘要
近期在半监督学习(SSL)领域的研究主要由基于一致性正则化的方法主导,这些方法表现出强大的性能。然而,它们严重依赖于特定领域的数据增强技术,而这些技术并非所有数据模态都容易生成。伪标签(PL)是一种通用的半监督学习方法,没有这种约束,但在其原始形式下性能相对较差。我们认为,伪标签表现不佳的原因在于模型校准不良导致的高置信度错误预测;这些预测生成了大量错误的伪标签,从而导致训练过程中的噪声增加。我们提出了一种不确定性感知的伪标签选择(UPS)框架,该框架通过大幅减少训练过程中遇到的噪声来提高伪标签的准确性。此外,UPS 框架泛化了伪标签生成过程,允许创建负伪标签;这些负伪标签不仅可用于多标签分类,还可用于负学习以改进单标签分类。我们在 CIFAR-10 和 CIFAR-100 数据集上与最近的半监督学习方法相比取得了优异的性能。同时,我们在 UCF-101 视频数据集和 Pascal VOC 多标签数据集上展示了我们方法的灵活性。