11 天前

基于解耦内部表示的k-Means聚类性能提升

Abien Fred Agarap, Arnulfo P. Azcarraga
基于解耦内部表示的k-Means聚类性能提升
摘要

深度聚类算法通过联合优化聚类损失与非聚类损失,将表示学习与聚类过程相结合。在这些方法中,通常采用深度神经网络进行表示学习,并辅以聚类网络。然而,不同于上述框架以提升聚类性能为目标,本文提出一种更为简洁的方法:通过优化自编码器所学习到的潜在表示的纠缠度(entanglement)来实现聚类。我们定义纠缠度为同一类别或结构中点对之间的相对紧密程度,相较于不同类别或结构之间的点对。为衡量数据点的纠缠度,我们采用软最近邻损失(soft nearest neighbor loss),并引入退火温度(annealing temperature)因子对其进行扩展。实验结果表明,采用该方法在MNIST数据集上的测试聚类准确率达到96.2%,在Fashion-MNIST数据集上达到85.6%,在EMNIST Balanced数据集上达到79.2%,均优于所设定的基线模型。

基于解耦内部表示的k-Means聚类性能提升 | 最新论文 | HyperAI超神经