16 天前

利用无约束未标记数据进行半监督学习的扩展

Shuvendu Roy, Ali Etemad
利用无约束未标记数据进行半监督学习的扩展
摘要

我们提出了一种名为UnMixMatch的半监督学习框架,该框架能够从无约束的未标注数据中学习到有效的特征表示,从而实现性能的可扩展提升。现有的大多数半监督学习方法均依赖于一个关键假设:标注样本与未标注样本来自同一分布,这一假设限制了利用自由获取的未标注数据所带来的性能提升潜力。因此,该假设在很大程度上制约了半监督学习方法的泛化能力与可扩展性。为克服上述局限,本方法旨在有效利用无约束的未标注数据,提升半监督学习的性能。UnMixMatch由三个核心组件构成:一是采用强数据增强策略的监督学习器,提供强有力的正则化;二是对比一致性正则化项,用于从未标注数据中学习深层的潜在表示;三是自监督损失函数,用于进一步增强从未标注数据中学习到的特征表示。我们在4个常用的基准数据集上进行了广泛的实验,结果表明,与现有半监督方法相比,UnMixMatch在性能上实现了显著提升,平均性能提升达4.79%。此外,通过系统的消融实验与敏感性分析,充分验证了所提出各组件的有效性及其对整体性能的贡献。

利用无约束未标记数据进行半监督学习的扩展 | 最新论文 | HyperAI超神经