2 个月前

DeepDPM:未知聚类数量的深度聚类

Meitar Ronen; Shahaf E. Finder; Oren Freifeld
DeepDPM:未知聚类数量的深度聚类
摘要

深度学习(DL)在无监督聚类任务中展现出巨大的潜力。然而,尽管在经典(即非深度)聚类中,非参数方法的优势已广为人知,但大多数深度聚类方法都是参数化的:也就是说,它们需要预定义且固定的聚类数量,记为K。当K未知时,使用模型选择准则来确定其最优值可能会变得计算成本高昂,尤其是在深度学习中,因为训练过程需要重复多次。在这项工作中,我们通过引入一种有效的深度聚类方法来弥合这一差距,该方法无需事先知道K的值,而是在学习过程中推断出它。利用分裂/合并框架、适应变化的K的动态架构以及新颖的损失函数,我们提出的方法在性能上优于现有的非参数方法(包括经典和深度方法)。虽然现有的少数几种深度非参数方法缺乏可扩展性,但我们首次展示了此类方法在ImageNet上的性能。此外,我们还通过实验展示了推断K的重要性:当假设的K值与实际值相差较大时,固定K的方法在性能上会显著下降,特别是在不平衡数据集上表现尤为明显。我们的代码可在https://github.com/BGU-CS-VIL/DeepDPM 获取。

DeepDPM:未知聚类数量的深度聚类 | 最新论文 | HyperAI超神经