
초록
머신 클러스터링과 딥 모델을 결합한 방법은 딥 클러스터링에서 뛰어난 성능을 보여주었습니다. 이 방법은 데이터 처리 파이프라인을 두 가지 교대 단계로 수정합니다: 특성 클러스터링과 모델 훈련. 그러나 이러한 교대 스케줄은 불안정성과 계산 부담 문제를 초래할 수 있습니다. 우리는 온라인 딥 클러스터링에 쉽게 적용할 수 있는 딥 학습 기술을 적극적으로 활용하기 위해 센터 없는 클러스터링 알고리즘인 확률 집계 클러스터링(Probability Aggregation Clustering, PAC)을 제안합니다. PAC는 클러스터 중심을 회피하고, 새로운 목적 함수를 사용하여 클러스터링을 최적화 문제로 정식화함으로써 확률 공간과 분포 공간을 일치시킵니다. PAC의 계산 메커니즘에 기반하여, 우리는 미니 배치 데이터에서 안정적이고 유연한 특성 클러스터링을 수행하기 위한 일반적인 온라인 확률 집계 모듈을 제안하며, 이를 바탕으로 딥 비주얼 클러스터링 프레임워크인 딥 PAC (Deep Probability Aggregation Clustering, DPAC)를 구축하였습니다. 광범위한 실험 결과는 PAC가 우수한 클러스터링 견고성과 성능을 가지고 있으며, DPAC가 최신 딥 클러스터링 방법론들을 크게 능가한다는 것을 입증하였습니다.