12일 전

생성적 적대형 클러스터링 네트워크를 위한 균형 잡힌 자체 주도 학습

{ Heng Huang, Cheng Deng, Xiaoqian Wang, Kamran Ghasedi}
생성적 적대형 클러스터링 네트워크를 위한 균형 잡힌 자체 주도 학습
초록

군집화는 다양한 머신러닝 응용 분야에서 중요한 문제이지만, 복잡한 실세계 데이터를 다룰 때 여전히 도전적인 과제로 남아 있다. 기존의 군집화 알고리즘은 데이터의 비선형 특성을 충분히 포착할 수 있는 능력이 부족한 얕은 모델을 사용하거나, 파라미터 수가 많아 과적합(overfitting)에 취약한 깊은 모델을 사용한다. 본 논문에서는 비지도 학습 방식으로 깊은 군집화 모델의 학습 문제를 해결하는 새로운 접근인 심층적 생성적 적대적 군집망(Deep Generative Adversarial Clustering Network, ClusterGAN)을 제안한다. ClusterGAN은 판별자(discriminator), 생성자(generator), 그리고 군집기(clusterer, 즉 군집화 네트워크)로 구성된 세 가지 네트워크로 이루어져 있다. 이 세 개의 네트워크는 서로 적대적인 게임을 통해, 판별 가능한 잠재 변수(latent variables)를 기반으로 현실적인 샘플을 생성자로부터 합성하고, 실제 샘플을 판별 가능한 임베딩 공간으로 매핑하는 역함수를 군집기로 학습한다. 또한, 군집 내 샘플 간 유사도를 증가시키고 군집 간 유사도를 감소시키기 위해 조건부 엔트로피 최소화 손실(conditional entropy minimization loss)을 활용한다. 군집화 작업에서는 진정한 유사도 정보가 알려져 있지 않기 때문에, 우리는 간단한 샘플부터 점진적으로 어려운 샘플까지 포함시키며, 모든 군집에서 선택된 샘플의 다양성을 고려하는 새로운 균형 잡힌 자기주도적 학습(self-paced learning) 알고리즘을 제안한다. 이를 통해 본 연구는 제안된 적대적 게임과 균형 잡힌 자기주도적 학습 알고리즘을 활용하여 깊이가 깊은 군집기를 효율적으로 학습할 수 있도록 하였다. 실험 결과, 여러 데이터셋에서 기존의 최신 군집화 및 해싱 모델들과 비교하여 경쟁력 있는 성능을 달성함을 확인하였다.

생성적 적대형 클러스터링 네트워크를 위한 균형 잡힌 자체 주도 학습 | 최신 연구 논문 | HyperAI초신경