HyperAI초신경

스펙트럼 클러스터링

스펙트럼 클러스터링그래프 이론을 기반으로 한 클러스터링 방법입니다. 가중치가 있는 무향 그래프를 두 개 이상의 최적 부분 그래프로 나눕니다. 하위 그래프는 내부적으로 유사하고 클러스터링을 달성하기 위해 멀리 떨어져 있습니다. 이 문제의 핵심은 클러스터링 문제를 그래프의 최적 분할 문제로 변환하는 것입니다. 이는 지점 간 클러스터링 알고리즘입니다.

기존 클러스터링 알고리즘과 비교했을 때, 스펙트럼 클러스터링은 임의의 모양 공간에서 샘플을 클러스터링하고 전역 최적 솔루션으로 수렴하는 기능을 가지고 있습니다. 이 알고리즘은 주어진 샘플을 기반으로 한 친화도 행렬을 정의하는데, 이는 쌍을 이루는 데이터 포인트의 유사성을 설명하는 데 사용되고, 행렬의 고유값과 고유 벡터를 계산하며, 서로 다른 데이터 포인트를 클러스터링하는 데 적합한 고유 벡터를 선택합니다. 스펙트럼 클러스터링 알고리즘은 원래 컴퓨터 비전, VLSI 설계 및 기타 분야에서 사용되었으며, 2005년까지 머신 러닝에 사용되지 않았습니다.

스펙트럼 클러스터링의 특성

스펙트럼 클러스터링은 널리 사용되는 클러스터링 알고리즘입니다. K-Means 알고리즘보다 데이터 분포에 대한 적응성이 강하고 클러스터링 효과가 뛰어납니다. 동시에 클러스터링 계산량이 더 작고 구현이 복잡하지 않습니다.

스펙트럼 클러스터링 방법

클러스터링은 샘플을 합리적으로 두 개 또는 K개의 부분으로 나누는 것입니다. 그래프 이론의 관점에서 보면 클러스터링 문제는 그래프 분할 문제와 동일합니다.

그래프 G = (V, E)가 주어졌을 때, 정점 집합 V가 각 샘플을 나타내고, 가중치가 있는 모서리가 각 샘플 간의 유사성을 나타낼 때, 스펙트럼 클러스터링의 목적은 분할 후 부분 그래프를 연결하는 모서리 가중치가 가능한 한 낮고 같은 부분 그래프 내의 모서리 가중치가 가능한 한 높아지도록 합리적인 분할 방법을 찾는 것입니다.

하위 단어: 클러스터링
관련 단어: 그래프 이론