
摘要
本文介绍了一项关于使用大型卷积网络进行半监督学习的研究。我们提出了一种基于教师/学生范式的流水线方法,该方法利用了大量未标记图像(最多可达10亿张)。我们的主要目标是提高特定目标架构的性能,例如ResNet-50或ResNeXt。我们对本方法的成功因素进行了详尽分析,并据此提出了一些建议,以生成高精度的模型用于图像分类的半监督学习。结果表明,我们的方法在图像、视频和细粒度分类的标准架构上带来了显著的性能提升。例如,通过利用10亿张未标记图像,我们训练的普通ResNet-50在ImageNet基准测试中达到了81.2%的Top-1准确率。