
摘要
当前最先进的目标检测模型通常在公开数据集上进行训练。然而,当应用于成像条件显著不同且缺乏相应标注数据(或标注成本高昂)的全新领域时,这些模型往往面临巨大挑战。一种自然的解决方案是通过域间图像表征的对齐来适应模型。例如,可通过对抗学习实现这一目标,在图像分类等任务中已被证明具有良好的效果。然而,我们发现,在目标检测任务中,此类方法带来的性能提升十分有限。其关键原因在于,传统域自适应方法倾向于对整个图像进行对齐,而目标检测本质上关注的是可能包含目标的局部区域。受此启发,我们提出了一种面向目标检测的新型域自适应方法,旨在解决“何处关注”与“如何对齐”两个核心问题。我们的核心思想是:挖掘对目标检测具有判别性的局部区域——即直接与目标识别相关的区域,并重点在源域与目标域之间对这些区域进行对齐。实验结果表明,所提方法在多种域偏移场景下均显著优于现有方法,性能提升达4%至6%,同时保持了良好的可扩展性。