
摘要
聚类是一类在计算机视觉中被广泛应用和研究的无监督学习方法。然而,将其适应于大规模数据集上视觉特征的端到端训练的研究却相对较少。在本工作中,我们提出了DeepCluster,一种同时学习神经网络参数和生成特征聚类分配的聚类方法。DeepCluster 迭代地使用标准的 k-means 聚类算法对特征进行分组,并利用随后的分配作为监督信号来更新网络权重。我们将 DeepCluster 应用于像 ImageNet 和 YFCC100M 这样的大规模数据集上的卷积神经网络的无监督训练。实验结果表明,该模型在所有标准基准测试中显著优于当前最先进的方法。