
摘要
本文研究语义分割中的领域泛化问题,旨在仅利用标注的合成(源域)数据训练出一个具有强鲁棒性的模型,使其在未见的真实(目标域)数据上也能表现良好。我们的研究发现,图像风格的差异会对模型性能产生显著影响,而图像的风格特征可通过其通道维度的均值与标准差有效表征。受此启发,我们提出一种新颖的对抗性风格增强方法(Adversarial Style Augmentation, AdvStyle),该方法在训练过程中可动态生成具有挑战性的风格化图像,从而有效防止模型在源域上过拟合。具体而言,AdvStyle将风格特征视为可学习参数,并通过对抗训练进行更新;所学习到的对抗性风格特征被用于构建对抗性图像,以增强模型的训练鲁棒性。AdvStyle实现简单,可无缝集成于多种模型架构中。在两个从合成数据到真实数据的语义分割基准测试上,实验结果表明,AdvStyle能显著提升模型在未见真实域上的性能,并达到当前最优水平。此外,该方法还可推广至领域泛化的图像分类任务,在所考察的数据集上均取得了明显的性能提升。