11 天前
一种用于目标检测的简单半监督学习框架
Kihyuk Sohn, Zizhao Zhang, Chun-Liang Li, Han Zhang, Chen-Yu Lee, Tomas Pfister

摘要
半监督学习(Semi-supervised Learning, SSL)具有利用未标注数据提升机器学习模型预测性能的潜力。尽管近年来取得了显著进展,但现有研究在SSL上的应用主要集中在图像分类任务。本文提出了一种名为STAC的简单而有效的视觉目标检测半监督学习框架,并配套设计了一种数据增强策略。STAC通过从未标注图像中提取高置信度的伪标签(pseudo labels)来定位目标物体,并利用强数据增强手段强制模型输出的一致性,从而实现模型更新。我们设计了基于MS-COCO数据集的实验评估协议,验证了半监督目标检测方法的性能。实验结果表明,STAC在MS-COCO和VOC07两个基准数据集上均表现出优异效果:在VOC07数据集上,STAC将AP$^{0.5}$从76.30提升至79.08;在MS-COCO数据集上,STAC展现出两倍的数据效率——仅使用5%的标注数据即达到24.38 mAP的性能,而监督学习基线模型在使用10%标注数据时仅获得23.86 mAP。相关代码已开源,地址为:https://github.com/google-research/ssl_detection/。