특성 부여된 그래프 클러스터링을 위한 그래프 오토인코더 모델의 재고찰

최근 그래프 클러스터링 방법들은 공동 클러스터링 및 임베딩 학습을 수행하기 위해 그래프 오토인코더(GAEs)를 활용해왔다. 그러나 두 가지 핵심적인 문제들이 간과되어 왔다. 첫째, 노이즈가 포함된 클러스터링 할당을 기반으로 학습할 경우 누적되는 오차는 클러스터링 모델의 효과성과 내구성에 악영향을 미친다. 이 문제는 '특성 무작위성(Feature Randomness)'이라 불린다. 둘째, 인접 행렬 재구성은 클러스터링 작업과 관련 없는 유사성 학습을 유도하게 되어 문제를 야기한다. 이 문제는 '특성 왜곡(Feature Drift)'이라 불린다. 흥미롭게도, 위의 두 문제 간 이론적 관계는 아직 탐구되지 않았다. 본 연구에서는 다음과 같은 두 가지 관점에서 이 문제들을 분석한다: (1) 클러스터링과 재구성 작업이 동일한 수준에서 수행될 경우, 특성 무작위성과 특성 왜곡 사이에 상충 관계가 존재하며, (2) 그래프 컨볼루션 연산과 그래프 디코딩 설계의 특성상, GAE 모델에서는 기존 오토인코더 모델에 비해 특성 왜곡 문제의 영향이 더욱 심각하다. 이러한 발견을 바탕으로, 우리는 GAE 기반 클러스터링 방법론을 재정의한다. 제안하는 해결책은 두 가지 측면으로 구성된다. 첫째, 노이즈가 있는 클러스터링 할당에 대한 보호 메커니즘을 활성화하는 샘플링 연산자 $Ξ$를 제안한다. 둘째, 재구성된 그래프를 클러스터링 중심으로 점진적으로 변환함으로써 특성 왜곡에 대응하는 보정 메커니즘을 유도하는 연산자 $Υ$를 제안한다. 본 방법의 주요 장점은 클러스터링의 효과성과 내구성에서 상당한 향상을 가져오며, 기존 GAE 모델에 쉽게 적용 가능하다는 점이다.