
摘要
在深度学习应用中,仅需每类标注一个样本并结合无标签数据即可达到全监督学习的性能,这一目标可谓理想状态。本文首次展示了在CIFAR-10和SVHN数据集上实现“单样本半监督学习”(One-Shot Semi-Supervised Learning, BOSS)的潜力,其测试准确率可与全监督学习相媲美。我们的方法融合了类别原型优化、类别平衡策略以及自训练机制。其中,选择优质的类别原型至关重要,为此我们提出了一种获取典型样本(iconic examples)的技术。此外,实验表明,引入类别平衡方法可显著提升半监督学习的准确率,使自训练机制达到与全监督学习相当的性能水平。严格的实证评估结果表明,训练深度神经网络并不需要对大规模数据集进行标注。我们已将代码开源至 https://github.com/lnsmith54/BOSS,以促进研究复现,并为未来实际应用场景提供支持。