
摘要
一种蓬勃发展的领域自适应分割趋势旨在为目标域生成高质量的伪标签,并在此基础上重新训练分割器。在这一自训练范式下,一些具有竞争力的方法尝试利用潜在空间信息,通过建立语义类别的特征中心点(即原型)并根据这些中心点的距离来确定伪标签候选者。本文认为潜在空间中包含更多可利用的信息,因此我们进一步挖掘其潜力。首先,不同于大多数传统方法仅使用源域原型来确定目标伪标签,我们双向生成目标域原型,以削弱那些可能对适应过程过于困难或受到干扰的源特征。其次,现有的尝试通常将每个类别建模为单一且各向同性的原型,而忽略了特征分布的方差,这可能导致相似类别的混淆。为了解决这一问题,我们提出通过高斯混合模型使用多个且各向异性的原型来表示每个类别,以便更好地拟合源域的实际分布,并基于概率密度估计目标样本的可能性。我们在GTA5→Cityscapes和Synthia→Cityscapes任务上应用了该方法,分别取得了61.2%和62.8%的平均交并比(mean IoU),显著优于其他具有竞争力的自训练方法。值得注意的是,在“卡车”和“公交车”等严重受类别混淆影响的类别中,我们的方法分别达到了56.4%和68.8%,进一步证明了我们设计的有效性。