
摘要
在半监督语义分割领域,教师-学生(teacher-student)框架广泛采用指数移动平均(Exponential Moving Average, EMA)机制,根据学生模型的权重动态更新单个教师模型的权重。然而,EMA更新机制存在一个关键问题:教师与学生模型的权重逐渐耦合,可能引发性能瓶颈。这一问题在使用复杂标签(如分割掩码)但标注数据极少的情况下尤为严重。本文提出了一种简单而高效的方法——Dual Teacher,通过引入两个临时教师(temporary teachers)来缓解教师与学生之间的权重耦合问题。这两个临时教师以轮换方式工作,并持续迭代优化,从而有效避免教师与学生模型在训练过程中过度接近。具体而言,临时教师按周期交替生成伪标签以训练学生模型,同时在每个训练周期内保持学生模型的多样化特征。这种机制显著提升了模型的泛化能力。实验结果表明,Dual Teacher在PASCAL VOC、Cityscapes和ADE20K等多个基准数据集上均取得了具有竞争力的性能,且训练时间显著短于当前最先进的方法。此外,我们验证了该方法具有模型无关性(model-agnostic),可兼容基于CNN和Transformer的各类模型架构。代码已开源,地址为:https://github.com/naver-ai/dual-teacher。