이미지 클러스터링을 위한 심층적 상관관계 채굴

최근 개발된 딥 비지도 학습 방법은 표현 학습과 라벨이 없는 데이터 클러스터링을 동시에 수행할 수 있게 해줍니다. 이러한 딥 클러스터링 방법들은 주로 샘플 간의 상관관계에 초점을 맞추고 있으며, 예를 들어 고정밀 쌍을 선택하여 점진적으로 특징 표현을 조정하는 것이지만, 다른 유용한 상관관계들을 간과하고 있습니다. 본 논문에서는 라벨이 없는 데이터에서 다양한 종류의 상관관계를 탐색하고 활용하기 위한 새로운 클러스터링 프레임워크인 '딥 포괄적 상관관계 마이닝(Deep Comprehensive Correlation Mining, DCCM)'을 제안합니다. 이 프레임워크는 다음과 같은 세 가지 측면에서 접근합니다:1) 단순히 쌍별 정보만 사용하는 대신, 가짜 라벨 감독(pseudo-label supervision)을 도입하여 범주 정보를 조사하고 차별적인 특징을 학습합니다.2) 입력 공간의 이미지 변환에 대한 특징들의 강건성을 충분히 탐구하여 네트워크 학습을 돕고 성능을 크게 향상시킵니다.3) 클러스터링 문제에 있어서 특징들 사이의 삼중 상호정보(triplet mutual information)를 제시하여 최근 발견된 인스턴스 수준의 딥 상호정보(instance-level deep mutual information)를 삼중 수준 형식으로 확장하며, 이는 더욱 차별적인 특징 학습에 도움을 줍니다.여러 어려운 데이터셋에 대한 광범위한 실험 결과, 본 방법론이 우수한 성능을 달성함을 보여주며, 예를 들어 CIFAR-10에서 62.3%의 클러스터링 정확도를 얻어 기존 최신 연구 결과보다 10.1% 높은 성능을 나타냈습니다.