
클러스터링은 사전에 정의된 레이블을 사용하지 않고 유사한 데이터 샘플을 클러스터로 묶는 작업이다. 이는 머신러닝 분야에서 광범위하게 연구되어 왔으며, 최근 딥러닝의 발전으로 인해 이 분야에 대한 관심이 다시 부각되고 있다. 대표적인 딥 클러스터링 기법인 대조 클러스터링(Contrastive Clustering, CC) 모델은 데이터 증강을 통해 각 데이터 인스턴스에 대한 긍정 쌍(positive pair)과 부정 쌍(negative pair)을 생성한다. CC 모델은 긍정 쌍의 인스턴스 수준 및 클러스터 수준 표현이 특성 공간 내에서 서로 가까워지도록 학습하는 것을 목표로 한다. 그러나 이러한 알고리즘은 클러스터링 성능 향상에 필수적인 인스턴스 간 상호작용 패턴을 무시함으로써, 오히려 모델의 거짓 음성 쌍(false-negative pair) 비율을 증가시키고 진짜 양성 쌍(true-positive pair) 비율을 감소시키는 문제가 존재한다.본 논문에서는 이러한 문제를 해결하기 위해, 인스턴스 간 관계를 고려하여 긍정 쌍의 수를 증가시키고, 거짓 음성, 노이즈, 이상치 샘플이 학습된 표현에 미치는 영향을 완화하는 새로운 대조 클러스터링 방법, 즉 ‘인스턴스 간 지도형 대조 클러스터링(Cross-instance guided Contrastive Clustering, C3)’을 제안한다. 특히, 인스턴스 수준 표현을 기반으로 유사한 인스턴스를 식별하고, 이를 집합적으로 모으도록 유도하는 새로운 손실 함수를 정의하였다. 또한, 보다 효율적인 부정 샘플 선택을 위한 새로운 가중치 방법을 제안하였다. 광범위한 실험 평가를 통해 제안한 방법이 기존 최고 성능(SOTA) 알고리즘을 초월함을 입증하였으며, 벤치마크 컴퓨터 비전 데이터셋에서 각각 CIFAR-10, CIFAR-100, ImageNet-10, ImageNet-Dogs, Tiny-ImageNet에서 클러스터링 정확도를 각각 6.6%, 3.3%, 5.0%, 1.3%, 0.3% 향상시켰다.