8 天前

领域对抗训练的免费午餐:环境标签平滑

YiFan Zhang, Xue Wang, Jian Liang, Zhang Zhang, Liang Wang, Rong Jin, Tieniu Tan
领域对抗训练的免费午餐:环境标签平滑
摘要

机器学习模型面临的一个根本性挑战是如何将已学习的模型泛化到分布外(out-of-distribution, OOD)数据。在诸多方法中,通过域对抗训练(Domain Adversarial Training, DAT)挖掘不变特征受到了广泛关注。尽管该方法取得了显著成效,但我们观察到DAT在训练过程中存在不稳定性,其主要原因在于域判别器过于自信以及环境标签存在噪声。为解决这一问题,我们提出了环境标签平滑(Environment Label Smoothing, ELS),该方法促使判别器输出软概率,从而降低其置信度,有效缓解了噪声环境标签带来的负面影响。我们通过实验与理论分析共同证明,ELS能够显著提升训练稳定性、局部收敛性,并增强对噪声环境标签的鲁棒性。将ELS与DAT方法相结合,我们在多种域泛化/域自适应任务上取得了当前最优的性能表现,尤其在环境标签噪声较高的情况下,优势更为显著。

领域对抗训练的免费午餐:环境标签平滑 | 最新论文 | HyperAI超神经