
摘要
在本文中,我们提出了一种用于联合无监督学习(Joint Unsupervised LEarning, JULE)深度表示和图像聚类的递归框架。在该框架中,聚类算法中的连续操作被表示为递归过程中的步骤,这些步骤堆叠在卷积神经网络(Convolutional Neural Network, CNN)输出的表示之上。在训练过程中,图像聚类和表示会同时更新:前向传播过程中进行图像聚类,而在反向传播过程中进行表示学习。该框架的核心思想是,良好的表示有助于图像聚类,而聚类结果则为表示学习提供了监督信号。通过将这两个过程整合到一个具有统一加权三元组损失的单一模型中,并对其进行端到端优化,我们不仅能够获得更强大的表示,还能获得更精确的图像聚类。大量实验表明,我们的方法在多种图像数据集上的图像聚类性能优于现有最先进方法。此外,所学得的表示在转移到其他任务时也表现出良好的泛化能力。