11 天前

对比层次聚类

Michał Znaleźniak, Przemysław Rola, Patryk Kaszuba, Jacek Tabor, Marek Śmieja
对比层次聚类
摘要

深度聚类长期以来主要依赖于扁平化模型,这类模型将数据集划分为预设数量的若干组。尽管近期的方法在主流基准测试中与真实标签达到了极高的相似度,但扁平划分所蕴含的信息仍较为有限。本文提出CoHiClust,一种基于深度神经网络的对比式层次聚类模型,适用于典型的图像数据。通过采用自监督学习策略,CoHiClust在无需任何标注数据的情况下,将基础网络提炼为一棵二叉树结构的层次聚类体系。该层次结构不仅可用于分析聚类之间的关系,还可用于衡量数据点之间的相似性。实验结果表明,CoHiClust生成的聚类结构合理,与人类直觉及图像语义高度一致。此外,在多数图像数据集上,其聚类准确率显著优于当前最先进的扁平聚类模型。

对比层次聚类 | 最新论文 | HyperAI超神经