PseCo:用于半监督目标检测的伪标签与一致性训练

在本文中,我们深入探讨了半监督目标检测(Semi-Supervised Object Detection, SSOD)中的两项关键技术——伪标签(pseudo labeling)与一致性训练(consistency training)。我们发现,当前这两种方法在很大程度上忽视了目标检测任务中一些关键特性,从而限制了对无标签数据的有效学习。具体而言,对于伪标签策略,现有工作仅关注分类置信度,却未能保证伪框(pseudo boxes)的定位精度;而对于一致性训练,广泛采用的随机缩放(random-resize)训练方式仅考虑了标签级别的一致性,忽略了特征级别的对齐,而后者在保障尺度不变性方面同样至关重要。为应对由噪声伪框带来的问题,我们提出了噪声伪框学习(Noisy Pseudo box Learning, NPL),其包含两个核心组件:预测引导的标签分配(Prediction-guided Label Assignment, PLA)与正样本提议的一致性投票(Positive-proposal Consistency Voting, PCV)。其中,PLA基于模型预测结果进行标签分配,使其对粗略的伪框也具有较强的鲁棒性;而PCV则通过正样本提议的回归一致性来反映伪框的定位质量,从而实现更可靠的伪标签生成。此外,在一致性训练方面,我们提出了多视角尺度不变学习(Multi-view Scale-invariant Learning, MSL),该方法同时引入标签级与特征级的一致性机制。其中,特征级一致性通过在内容相同但尺度不同的两张图像之间对齐其特征金字塔(feature pyramids)来实现,有效增强了模型对尺度变化的鲁棒性。在COCO基准测试中,我们提出的方法——伪标签与一致性训练(PSEudo labeling and COnsistency training, PseCo),在1%、5%和10%标注比例下,分别相较于当前最优方法(Soft Teacher)取得了2.0、1.8和2.0的mAP提升。同时,PseCo显著提升了半监督目标检测的学习效率:在训练时间上仅为当前最优方法的一半,却实现了更优的检测性能。相关代码已开源,地址为:https://github.com/ligang-cs/PseCo。