
摘要
无监督学习一直吸引着机器学习研究人员和实践者,因为它可以避免昂贵且复杂的数据标注过程。然而,复杂数据的无监督学习具有挑战性,即使是最先进的方法也表现出远不如其有监督对应方法的性能。自监督深度学习已成为计算机视觉中表示学习的强大工具。然而,这些方法尚未在完全无监督的环境中进行评估。本文提出了一种基于自监督表示的简单无监督分类方案。我们使用几种最近的自监督方法对所提出的方案进行了评估,结果显示该方案在ImageNet分类任务中取得了具有竞争力的结果(使用1000个聚类中心时准确率为39%,使用过聚类时准确率为46%)。我们建议将无监督评估加入到自监督学习的标准基准测试集当中。代码已发布在 https://github.com/Randl/kmeans_selfsuper。注释:- "overclustering" 翻译为“过聚类”,指在聚类过程中使用的聚类中心数多于实际类别数的一种技术。- “kmeans_selfsuper” 是项目名称,保留原文。