11 天前

对抗性深度嵌入聚类:在特征随机性与特征漂移之间的更优权衡

Nairouz Mrabah, Mohamed Bouguessa, Riadh Ksantini
对抗性深度嵌入聚类:在特征随机性与特征漂移之间的更优权衡
摘要

近年来,基于深度自编码器的聚类方法已得到广泛研究。现有方法通常同时学习数据的嵌入特征,并在潜在空间中对数据点进行聚类。尽管多种深度聚类方法在多个高语义层次的数据集上已显著优于浅层模型,但这类模型存在一个被忽视的关键缺陷:在缺乏明确监督信号的情况下,嵌入聚类的目标函数可能因依赖不可靠的伪标签而扭曲潜在空间,导致网络学习到非代表性的特征,进而削弱模型的判别能力,最终生成更差的伪标签。为缓解随机判别特征带来的负面影响,当前基于自编码器的聚类方法通常采用重建损失进行预训练,并在聚类阶段将其作为正则项。然而,这种重建与聚类之间的权衡关系可能导致所谓的“特征漂移”(Feature Drift)现象。本文提出一种新型自编码器聚类模型——ADEC(Adversarial Deep Embedded Clustering),通过对抗训练机制,同时解决“特征随机性”(Feature Randomness)与“特征漂移”两大核心问题。我们在多个基准真实数据集上通过实验证明了该模型在应对上述问题方面的有效性。实验结果表明,ADEC在性能上优于当前最先进的基于自编码器的聚类方法。

对抗性深度嵌入聚类:在特征随机性与特征漂移之间的更优权衡 | 最新论文 | HyperAI超神经