2달 전
$K$-means 클러스터링과 계층적 클러스터링을 결합하여 일반적인 형태의 그룹 식별
Anna D. Peterson; Arka P. Ghosh; Ranjan Maitra

초록
클러스터링은 데이터셋을 분할하여 같은 그룹에 배치된 관측치들이 서로 유사하지만 다른 그룹의 관측치들과는 다르도록 하는 기술입니다. 계층적 클러스터링과 $K$-평균 클러스터링은 두 가지 접근 방식이지만, 각각 장점과 단점이 다릅니다. 예를 들어, 계층적 클러스터링은 나무 구조와 같은 형태로 그룹을 식별하지만, 큰 데이터셋에서는 계산 복잡도가 문제가 됩니다. 반면 $K$-평균 클러스터링은 효율적이지만, 균일한 구형 클러스터를 식별하도록 설계되어 있습니다.본 연구에서는 일반적인 형태의 클러스터를 식별하고 더 큰 데이터셋에도 적용할 수 있는 하이브리드 비모수 클러스터링 방법을 제시합니다. 구체적으로, 먼저 $K$-평균 알고리즘을 사용하여 데이터셋을 구형 그룹으로 분할합니다. 다음으로, 데이터 주도 거리 측정값을 중단 기준으로 사용하여 이들 그룹을 계층적 방법으로 병합합니다. 본 제안 방법은 데이터셋 내에서 일반적인 형태와 구조를 가진 그룹을 밝혀낼 잠재력을 가지고 있습니다. 우리는 여러 시뮬레이션 및 실제 데이터셋에서 좋은 성능을 보임으로써 이를 입증하였습니다.