
摘要
领域自适应旨在将从源域中学习到的共享知识迁移到新的目标域环境中。一种常见的做法是,在有标签的源域数据和无标签的目标域数据上共同训练模型。然而,由于源域提供了较强的监督信号,所学习到的模型通常存在偏差。大多数研究者采用早停(early-stopping)策略来防止过拟合,但何时停止训练仍是一个难题,原因在于缺乏目标域的验证集。本文提出了一种高效且新颖的自举(bootstrapping)方法,称为 AdaBoost Student,该方法在训练过程中显式地学习互补模型,从而摆脱对经验性早停策略的依赖。AdaBoost Student 将深度模型学习与传统的自适应提升(adaptive boosting)训练策略相结合,实现了模型与数据采样器之间的动态交互。我们引入了一种自适应数据采样机制,逐步加强对困难样本的学习,并通过聚合“弱”模型来有效防止过拟合。大量实验结果表明:(1)无需关心训练停止时机,AdaBoost Student 通过在训练过程中高效地学习互补模型,提供了一种鲁棒的解决方案;(2)AdaBoost Student 与大多数现有领域自适应方法具有正交性,可与已有方法无缝结合,进一步提升当前最先进性能。我们在三个广泛使用的场景分割领域自适应基准数据集上均取得了具有竞争力的实验结果。