7 个月前

摘要

最近的半监督深度学习（深度SSL）方法大多采用了类似的范式：利用网络预测更新伪标签，并利用伪标签迭代更新网络参数。然而，这些方法缺乏理论支持，无法解释为什么预测结果是伪标签的良好候选者。在本文中，我们提出了一种原则性的端到端框架，称为深度解密（Deep Decipher，D2），用于半监督学习（SSL）。在D2框架内，我们证明了伪标签与网络预测之间存在指数链接函数关系，这为使用预测结果作为伪标签提供了理论依据。此外，我们还展示了通过网络预测更新伪标签会使它们变得不确定。为了解决这一问题，我们提出了一种称为重复再预测（Repetitive Reprediction，R2）的训练策略。最后，所提出的R2-D2方法在大规模ImageNet数据集上进行了测试，并比现有最先进方法提高了5个百分点。

源 PDF