
摘要
自训练方法近年来在领域自适应语义分割中占据了重要地位,其核心思想是利用目标域的伪标签对模型进行训练。尽管当前研究已有效缓解了因域差异导致的伪标签噪声问题,但在语义分类器边界附近仍难以避免错误伪标签的产生。针对这一挑战,本文提出一种面向语义分割的双层交互领域自适应方法(Dual-Level Interaction for Domain Adaptation, DIDA)。具体而言,我们促使同一像素在不同增强视图下的表现不仅在类别预测上保持一致(语义层面),同时在与其他像素的相似性关系上也趋于一致(实例层面)。由于无法存储整个数据集中所有像素实例的特征,我们设计了一个动态更新策略的有标签实例库,仅选择性地保留具有信息量的实例特征。此外,DIDA通过散射与聚合技术实现跨层次交互,从而生成更为可靠的伪标签。实验结果表明,该方法显著优于现有最先进方法,尤其在易混淆类别和长尾类别上表现突出。代码已开源,地址为:\href{https://github.com/RainJamesY/DIDA}{https://github.com/RainJamesY/DIDA}。