2 个月前

学习自训练以实现半监督少样本分类

Xinzhe Li; Qianru Sun; Yaoyao Liu; Shibao Zheng; Qin Zhou; Tat-Seng Chua; Bernt Schiele
学习自训练以实现半监督少样本分类
摘要

少样本分类(Few-shot classification, FSC)由于标记训练数据的稀缺(例如每类只有一个标记数据点)而具有挑战性。元学习方法通过学习初始化一个用于FSC的分类模型,已经显示出取得令人鼓舞的结果。在本文中,我们提出了一种新颖的半监督元学习方法——学习自我训练(Learning to Self-Train, LST),该方法利用未标记数据,并特别元学习如何挑选和标记这些无监督数据以进一步提高性能。为此,我们通过大量半监督少样本任务来训练LST模型。在每个任务中,我们训练一个少样本模型来预测未标记数据的伪标签,然后在标记数据和伪标签数据上迭代进行自我训练步骤,每一步之后都进行微调。此外,我们还学习了一个软权重网络(Soft Weighting Network, SWN),以优化伪标签的自我训练权重,从而使更好的伪标签对梯度下降优化做出更大的贡献。我们在两个ImageNet基准测试集上评估了我们的LST方法,在半监督少样本分类任务中取得了比现有最先进方法显著的改进。代码位于https://github.com/xinzheli1217/learning-to-self-train。