2 个月前
MixMatch:半监督学习的综合方法
David Berthelot; Nicholas Carlini; Ian Goodfellow; Nicolas Papernot; Avital Oliver; Colin Raffel

摘要
半监督学习已被证明是一种强大的范式,能够利用未标记数据来减少对大规模标记数据集的依赖。在本研究中,我们将当前主流的半监督学习方法统一起来,提出了一种新的算法——MixMatch,该算法通过为数据增强后的未标记样本预测低熵标签,并使用MixUp技术混合标记和未标记数据来实现其目标。我们展示了MixMatch在多个数据集和不同数量的标记数据上取得了显著优于现有方法的结果。例如,在CIFAR-10数据集中仅使用250个标签时,我们的错误率降低了4倍(从38%降至11%),而在STL-10数据集上则降低了2倍。此外,我们还演示了如何通过MixMatch实现差分隐私中的精度与隐私保护之间的显著改进。最后,我们进行了消融实验,以分析MixMatch成功的关键因素。注释:- 半监督学习(Semi-supervised learning):一种机器学习方法,结合了少量有标签的数据和大量无标签的数据进行训练。- 低熵标签(low-entropy labels):指具有较高置信度的预测标签。- MixUp:一种数据增强技术,通过对输入样本及其对应标签进行线性插值来生成新的训练样本。- 差分隐私(Differential privacy):一种隐私保护机制,旨在确保数据分析结果不会泄露任何个体的具体信息。- 消融实验(Ablation study):通过移除模型中的某些组件或特征来评估它们对整体性能的影响。