6 个月前

摘要

近年来，许多半监督学习（Semi-Supervised Learning, SSL）研究采用教师-学生架构，通过教师网络生成的监督信号来训练学生网络。在SSL框架中，数据增强策略起着至关重要的作用，因为若无法在不丢失标签信息的前提下构建弱增强与强增强的输入对，将难以有效提升模型性能。尤其在将SSL扩展至半监督目标检测（Semi-Supervised Object Detection, SSOD）任务时，许多与图像几何变换及插值正则化相关的强增强方法难以应用，因为它们可能破坏目标检测任务中边界框的位置信息。针对这一问题，本文提出一种简单而高效的数据增强方法——Mix/UnMix（MUM），该方法在SSOD框架中对混合图像块进行特征空间内的解混合操作。具体而言，MUM首先对输入图像块进行混合处理，随后在特征空间中对其进行重构，从而实现对混合图像的恢复。该机制使得MUM能够充分利用非插值伪标签带来的插值正则化效果，并成功生成具有语义意义的弱-强增强图像对。此外，MUM可无缝集成于多种现有的SSOD方法之上，具有良好的通用性。在MS-COCO与PASCAL VOC数据集上的大量实验表明，MUM在所有测试的SSOD基准协议中均能稳定提升模型的平均精度（mAP），显著优于各类基线方法，充分验证了其有效性与优越性。

源 PDF