2달 전

Git: 강도 토폴로지 기반 클러스터링

Zhangyang Gao; Haitao Lin; Cheng Tan; Lirong Wu; Stan. Z Li
Git: 강도 토폴로지 기반 클러스터링
초록

정확성(Accuracy), 잡음과 스케일에 대한 강건성(Robustness to noises and scales), 해석 가능성(Interpretability), 속도(Speed), 그리고 사용 편의성(Easy to use) (ARISE)는 우수한 클러스터링 알고리즘의 핵심 요구사항입니다. 그러나 이러한 목표를 동시에 달성하는 것은 어려운 문제이며, 대부분의 고급 접근 방식은 이들 중 일부만 집중합니다. 이러한 측면을 전반적으로 고려하기 위해, 우리는 새로운 클러스터링 알고리즘인 GIT (\textbf{G}raph of \textbf{I}ntensity \textbf{T}opology 기반 클러스터링)을 제안합니다.GIT는 로컬 및 글로벌 데이터 구조 모두를 고려합니다: 먼저 샘플의 강도 피크를 기반으로 로컬 클러스터를 형성하고, 그 다음에는 이러한 로컬 클러스터 간의 글로벌 위상 그래프(topo-graph)를 추정합니다. 우리는 예측된 클래스 비율과 사전 클래스 비율 사이의 Wasserstein 거리를 사용하여 topo-graph에서 잡음이 있는 엣지를 자동으로 잘라내고, 연결된 로컬 클러스터를 최종 클러스터로 병합합니다.그 후, 우리는 GIT를 5개의 합성 데이터셋과 9개의 실제 세계 데이터셋에서 7개의 경쟁 알고리즘들과 비교했습니다. 빠른 로컬 클러스터 검출, 강건한 topo-graph 구성 및 정확한 엣지 잘림을 통해 GIT는 매력적인 ARISE 성능을 보여주며, 다른 비볼록(non-convex) 클러스터링 방법들을 크게 초월합니다. 예를 들어, MNIST와 FashionMNIST에서 GIT는 F1 점수로 약 10% 더 높은 성능을 보였습니다. 코드는 \color{red}{https://github.com/gaozhangyang/GIT}에서 제공됩니다.

Git: 강도 토폴로지 기반 클러스터링 | 최신 연구 논문 | HyperAI초신경