11 天前

基于共关联矩阵中提取的证据的集成聚类

摘要

证据累积模型是一种聚类集成方法中用于收集基础聚类划分信息的策略,可被视为从原始数据空间到共关联矩阵的核映射过程。然而,在这一映射过程中,部分聚类结构信息可能遭到损失;因此,文献中已有部分方法致力于恢复这些丢失的信息并将其重新引入集成过程。本文提出一个有趣的现象:从共关联矩阵中移除部分证据,反而能够获得更精确的聚类结果。其直观解释是,原始共关联矩阵中某些证据可能为噪声,对最终聚类结果产生负面影响。然而,实际中难以有效识别这些噪声证据,更遑论将其从矩阵中剔除。为解决该问题,本文提出移除出现频率较低的多层次证据,因为负面证据在基础聚类划分中通常不会呈现出规律性出现的特征。随后,采用归一化割(normalized cut)方法获得多个聚类结果。为进一步甄别最优集成结果,本文特别设计了一种仅依赖共关联矩阵的内部有效性指标,用于评估聚类集成效果。在16个数据集上的实验结果表明,所提出的方案在性能上优于若干当前先进的聚类集成方法。

基于共关联矩阵中提取的证据的集成聚类 | 最新论文 | HyperAI超神经