2 个月前

探索自监督正则化在监督学习和半监督学习中的应用

Phi Vu Tran
探索自监督正则化在监督学习和半监督学习中的应用
摘要

近期在半监督学习领域的进展展示了克服现代机器学习算法成功的主要障碍的巨大潜力:获取大量人工标注的训练数据。基于一致性正则化的先前算法能够利用未标注数据的丰富性,在多个半监督基准测试中取得令人印象深刻的结果,仅使用少量可用的标注数据就能接近强大的监督基线模型的性能。在这项工作中,我们通过引入自监督正则化作为结合未标注数据中的语义特征表示的基础,对一致性正则化长期以来的成功提出了挑战。我们进行了广泛的对比实验,以证明自监督正则化在 SVHN、CIFAR-10 和 CIFAR-100 基准数据集上的监督和半监督图像分类中的有效性。我们主要展示了两个结果:(1) 通过自监督正则化增强的模型在不需要未标注数据的情况下显著改进了传统的监督分类器;(2) 结合未标注数据,我们的模型在半监督性能上与之前的最先进的一致性基线模型相当,且在许多情况下超过了这些基线模型。最后,我们的模型具有实际应用价值,可以高效地进行端到端训练,并且除了用于训练神经网络的标准超参数外,无需额外调整任何超参数即可达到最佳性能。参考代码和数据可在 https://github.com/vuptran/sesemi 获取。

探索自监督正则化在监督学习和半监督学习中的应用 | 最新论文 | HyperAI超神经