16일 전
대비 계층적 클러스터링
Michał Znaleźniak, Przemysław Rola, Patryk Kaszuba, Jacek Tabor, Marek Śmieja

초록
딥 클러스터링은 데이터셋을 미리 정의된 수의 그룹으로 나누는 평면형 모델에 의해 주도되어 왔다. 최근의 방법들은 주요 벤치마크에서 지표 데이터와 매우 높은 유사도를 달성하고 있지만, 평면적 분할 구조에 포함된 정보는 제한적이다. 본 논문에서는 깊은 신경망 기반의 대조형 계층적 클러스터링 모델인 CoHiClust을 제안한다. 이 모델은 일반적인 이미지 데이터에 적용 가능하며, 레이블이 없는 데이터에 접근하지 않고도 자가지도 학습 방식을 활용하여 기반 네트워크를 이진 트리 구조로 압축한다. 계층적 클러스터링 구조는 클러스터 간의 관계를 분석하고, 데이터 포인트 간의 유사도를 측정하는 데 활용할 수 있다. 실험 결과, CoHiClust은 우리의 직관과 이미지 의미론과 일치하는 합리적인 클러스터 구조를 생성함을 보여주며, 기존 최고 수준의 평면형 클러스터링 모델들에 비해 대부분의 이미지 데이터셋에서 뛰어난 클러스터링 정확도를 달성한다.