
摘要
我们能否在没有实例级注释的情况下检测多种图像域中的常见物体?本文提出了一种针对新型任务——跨域弱监督物体检测的框架,旨在回答这一问题。在本研究中,我们拥有来自源域(例如,自然图像)的带有实例级注释的图像以及目标域(例如,水彩画)的带有图像级注释的图像。此外,目标域中需要检测的类别全部或部分包含在源域中。基于一个已在源域上预训练的全监督物体检测器,我们提出了一种两步渐进式领域适应技术,通过微调检测器在两种类型的人工和自动生成样本上进行训练。我们在新收集的数据集上测试了我们的方法,该数据集包含三个图像域,在平均精度均值(mean average precision, mAP)方面相比最佳基线方法提高了约5到20个百分点。