
摘要
领域自适应全景分割有望解决自然场景理解中长期存在的长尾边缘案例问题。以往的最先进方法通过跨任务一致性、系统级精细优化以及对教师模型预测的启发式改进来应对该挑战。相比之下,我们提出利用掩码变换器(mask transformer)自身估计预测不确定性的卓越能力,构建更优的分割框架。所提方法通过利用全景教师模型的细粒度置信度,有效避免了噪声放大问题。具体而言,我们基于掩码级别的置信度对损失函数进行调制,并在教师预测不确定或学生预测置信度较高的像素上禁止反向传播。在标准基准上的实验评估表明,所提出的筛选机制具有显著贡献。我们在Synthia到Cityscapes的域适应任务上取得了47.4的PQ指标,相比现有最先进方法提升了6.2个百分点。源代码已公开,地址为:https://github.com/helen1c/MC-PanDA。