
초록
딥러닝(DL)은 클러스터링의 비지도 작업에서 큰 잠재력을 보여주고 있습니다. 그러나 고전적인(즉, 딥이 아닌) 클러스터링에서는 비모수적 접근 방식의 이점이 잘 알려져 있는 반면, 대부분의 딥 클러스터링 방법은 모수적입니다. 즉, 사전에 정의되고 고정된 클러스터 수 K가 필요합니다. 그러나 K가 알려지지 않은 경우, 최적 값을 선택하기 위해 모델 선택 기준을 사용하는 것은 특히 DL에서 훈련 과정을 여러 번 반복해야 하므로 계산적으로 비용이 많이 들 수 있습니다. 본 연구에서는 이러한 간극을 메우기 위해 K 값이 필요하지 않고 학습 중에 이를 추론하는 효과적인 딥 클러스터링 방법을 소개합니다. 분할/병합 프레임워크, K 변화에 적응하는 동적 아키텍처, 그리고 새로운 손실 함수를 사용하여 제안된 방법은 기존의 비모수적 방법(고전적인 것과 딥인 것 모두)보다 우수한 성능을 보입니다. 기존의 몇 안 되는 딥 비모수적 방법들은 확장성에 문제가 있지만, 우리는 ImageNet에서 이러한 방법의 성능을 처음으로 보고함으로써 우리의 방법의 확장성을 입증하였습니다. 또한 K를 고정하는 방법들이 실제 K 값과 가정된 K 값 사이의 차이가 커질수록 특히 불균형 데이터셋에서 성능이 저하되는 것을 보여줌으로써 K를 추론하는 것이 얼마나 중요한지를 입증하였습니다. 우리의 코드는 https://github.com/BGU-CS-VIL/DeepDPM에서 확인할 수 있습니다.