HyperAI超神经

谱聚类 Spectral Clustering

谱聚类是一种基于图论的聚类方法,其将带权无向图划分为两个或两个以上最优子图,子图内部相似且间距离较远以实现聚类,其本质是将聚类问题转化为图的最优划分问题,是一种点对聚类算法。

相比传统聚类算法,谱聚类具有在任意形状样本空间上聚类,可收敛于全局得出最优解,该算法根据给定的样本定义一个亲合矩阵,其被用于描述成对数据点的相似度,并以此计算矩阵的特征值和特征向量,选择合适的特征向量聚类不同的数据点,谱聚类算法最初用于计算机视觉、 VLSI 设计等领域,2005 年才开始用于机器学习。

谱聚类的特点

谱聚类是广泛使用的聚类算法,其对数据分布的适应性比 K-Means 算法强,聚类效果优秀,同时聚类的计算量更小,而且实现起来也不复杂。

谱聚类的方法

聚类是把样本合理地分成两份或者 K 份,从图论的角度来看,聚类问题相当于图的分割问题。

给定一个图 G = ( V , E ) ,其中顶点集 V 表示各个样本,带权的边表示各个样本之间的相似度,谱聚类目的是要找到一种合理分割的方法,使得分割后连接子图的边权重尽可能低,同子图内的边的权重尽可能高。

子级词:聚类
相关词:图论