
초록
스펙트럼 클러스터링은 가장 인기 있는 클러스터링 방법 중 하나입니다. 그러나, 제한된 컴퓨팅 자원으로 대규모 스펙트럼 클러스터링의 효율성과 효과성을 균형 있게 유지하는 문제는 오랫동안 적절히 해결되지 않았습니다. 본 논문에서는 효율성과 효과성 사이에서 좋은 균형을 이루는 분할-통합 기반의 대규모 스펙트럼 클러스터링 방법을 제안합니다. 제안된 방법에서는 분할-통합 기반의 랜드마크 선택 알고리즘과 새로운 근사 유사도 행렬 접근법을 설계하여 낮은 계산 복잡도로 희소 유사도 행렬을 구성합니다. 그런 다음 이분 그래프 파티션 과정을 통해 클러스터링 결과를 신속하게 계산할 수 있습니다. 제안된 방법은 대부분의 기존 대규모 스펙트럼 클러스터링 방법보다 낮은 계산 복잡도를 달성합니다. 10개의 대규모 데이터셋에 대한 실험 결과는 제안된 방법의 효율성과 효과성을 입증하였습니다. 제안된 방법의 MATLAB 코드와 실험 데이터셋은 https://github.com/Li-Hongmin/MyPaperWithCode 에서 제공됩니다.