2달 전
깊은 클러스터링: 판별 모델과 K-means 간의 관계에 대해
Mohammed Jabi; Marco Pedersoli; Amar Mitiche; Ismail Ben Ayed

초록
최근의 딥 클러스터링 연구에서 판별 모델이 문헌을 주도하며 가장 경쟁력 있는 성능을 보고하고 있습니다. 이러한 모델은 라벨이 잠재적인 상태에서 딥 판별 신경망 분류기를 학습합니다. 일반적으로, 이들은 지도 학습에서 매우 흔히 사용되는 다항 로지스틱 회귀 사후확률과 매개변수 정규화를 활용합니다. 판별 목적 함수(예: 상호 정보량 또는 KL 발산 기반)는 생성적 접근 방식(예: K-평균)보다 데이터 분포에 대한 가정을 덜 하므로 더 유연하다는 점에서 널리 인정받고 있으며, 일반적으로 훨씬 더 우수한 비지도 딥 러닝 결과를 제공합니다. 겉으로 보기에는 최근의 몇몇 판별 모델들이 K-평균과 관련이 없어 보일 수 있지만, 본 연구에서는 이러한 모델들이 온건한 조건과 일반적인 사후확률 모델 및 매개변수 정규화 하에서 사실상 K-평균과 동등하다는 것을 보여줍니다. 우리는 일반적으로 사용되는 로지스틱 회귀 사후확률에 대해 $L_2$ 정규화된 상호 정보량을 근사 교차 방향 방법(ADM)을 통해 최대화하는 것이 부드럽고 정규화된 K-평균 손실과 동등함을 증명하였습니다. 우리의 이론적 분석은 직접적으로 최근의 여러 최신 판별 모델들을 K-평균과 연결시키는 것뿐만 아니라, 여러 이미지 클러스터링 벤치마크에서 경쟁력 있는 성능을 나타내는 새로운 부드럽고 정규화된 딥 K-평균 알고리즘을 제시하는데도 이르렀습니다.