
摘要
预测结构化输出(如语义分割)依赖于昂贵的逐像素注释来学习监督模型,例如卷积神经网络。然而,仅在一个数据域上训练的模型在没有注释用于微调的情况下可能无法很好地泛化到其他域。为了避免耗时且劳动密集型的注释过程,我们开发了一种领域适应方法,以将源数据适应到未标记的目标域。我们提出通过构建聚类空间来发现补丁级输出分布的多个模式,从而学习源域中补丁的判别特征表示。以此表示为指导,我们采用对抗学习方案,将目标域中的补丁特征表示推向与源域补丁分布更接近的位置。此外,我们证明了我们的框架可以与现有的领域适应技术互补,并在语义分割任务上实现了一致的性能提升。我们在多个基准数据集上进行了广泛的消融实验和结果展示,涵盖了各种设置,如从合成数据到真实数据以及跨城市场景。