
摘要
领域自适应目标检测(Domain Adaptive Object Detection, DAOD)旨在利用带标注的源域数据训练一个能够泛化至无标注目标域的检测模型。近年来,研究多采用教师-学生框架,即学生模型通过教师模型生成的伪标签进行监督。尽管取得了显著进展,但该方法仍受限于因领域差异导致的伪框数量有限且存在错误预测的问题,从而误导学生模型,使其难以获得最优性能。为缓解这一问题,本文提出一种基于掩码自编码器的重训练教师-学生框架(Masked Retraining Teacher-student framework, MRT)。该框架在检测Transformer架构上引入掩码自编码器与选择性重训练机制。具体而言,我们设计了一种定制化的掩码自编码器分支:对目标域图像的多尺度特征图进行掩码,并由学生模型的编码器与辅助解码器联合重建被掩码的特征。该机制有助于学生模型更好地捕捉目标域的内在特征,提升其在伪框数量有限情况下的知识学习效率,实现更高效的数据利用。此外,我们引入选择性重训练机制,定期将学生模型的部分参数以掩码自编码器优化后的权重进行重新初始化,从而帮助模型跳出因错误伪标签引发的局部最优陷阱,增强其泛化能力。在三个主流DAOD基准上的实验结果表明,所提方法显著优于现有方法,具有优异的性能表现。代码已开源,地址为:https://github.com/JeremyZhao1998/MRT-release。