11 天前

冷PAWS:无监督类别发现与半监督学习中的冷启动问题解决

Evelyn J. Mannix, Howard D. Bondell
冷PAWS:无监督类别发现与半监督学习中的冷启动问题解决
摘要

在众多机器学习应用中,数据集的标注往往是一项耗时且繁琐的任务。尽管已有研究表明,在计算机视觉领域,半监督学习技术仅需极少标注样本即可实现较高精度,但针对数据集中应如何选择图像进行标注的研究却相对较少。本文提出一种基于成熟自监督学习、聚类与流形学习技术的新型方法,旨在解决初始阶段如何选择具有信息量的图像子集进行标注这一挑战,即所谓的“冷启动”或“无监督选择性标注”问题。我们在多个公开可用的数据集(包括CIFAR10、Imagenette、DeepWeeds和EuroSAT)上验证了该方法的有效性,结果表明,相较于随机采样,采用本文提出的标签选择策略后,无论是监督学习还是半监督学习策略均取得了更优的性能表现。此外,与文献中其他方法相比,本方法在所考察数据集上以更为简洁的实现方式获得了更优越的性能。

冷PAWS:无监督类别发现与半监督学习中的冷启动问题解决 | 最新论文 | HyperAI超神经