
최근 들어, 레이블이 없는 데이터를 활용하여 클러스터링을 학습하는 비지도 딥 러닝 방법들이 다수 제안되어 왔다. 데이터 증강을 도입함으로써, 대부분의 최신 방법들은 원본 이미지와 그 변환된 이미지가 동일한 의미적 클러스터링 할당을 가져야 한다는 관점에서 딥 클러스터링을 탐구하고 있다. 그러나 소프트맥스 함수는 최대값에만 민감하기 때문에, 동일한 클러스터에 할당된 경우에도 표현 특징이 매우 다를 수 있다. 이로 인해 표현 특징 공간 내에서 클래스 내 분산이 커지게 되며, 이는 국소 최적해의 불안정성을 초래하고 결과적으로 클러스터링 성능을 저해할 수 있다. 이러한 단점을 해결하기 위해 우리는 '딥 로버스트 클러스터링(Deep Robust Clustering, DRC)'을 제안한다. 기존 방법들과 달리, DRC는 의미적 클러스터링 할당과 표현 특징이라는 두 가지 관점에서 딥 클러스터링을 접근함으로써, 클래스 간 분산을 증가시키고 클래스 내 분산을 감소시키는 동시에 가능하게 한다. 또한, 상호정보량(mutual information)과 대비 학습(contrastive learning) 간의 내적 관계를 분석함으로써, 어떤 상호정보량 최대화 기반 방법도 대비 손실(minimizing contrastive loss)로 전환할 수 있는 일반적인 프레임워크를 정리하였다. 이를 DRC에 성공적으로 적용하여 불변 특징과 강건한 클러스터를 학습하였다. 다섯 개의 널리 사용되는 딥 클러스터링 벤치마크에서 실시한 광범위한 실험 결과, DRC는 안정성과 정확성 측면에서 우수한 성능을 입증하였다. 예를 들어, CIFAR-10에서 평균 정확도 71.6%를 달성하여 최신 기술 대비 7.1% 높은 성능을 기록하였다.