그래프 오토인코더를 이용한 유도적 행렬 완성

최근 그래프 신경망(GNN)은 평가 행렬을 이분 그래프로 표현하고 사용자 및 항목 노드 간의 링크를 예측함으로써 행렬 완성(major matrix completion)에서 큰 성능을 보여주고 있다. 대부분의 GNN 기반 행렬 완성 방법은 그래프 오토인코더(GAE)를 기반으로 하며, 이는 원-핫 인덱스를 입력으로 하여 사용자(또는 항목) 인덱스를 학습 가능한 임베딩으로 매핑하고, 이러한 학습 가능한 임베딩을 기반으로 GNN을 통해 노드별 표현을 학습한 후, 목표 사용자와 그에 대응하는 항목 노드의 표현을 집계하여 누락된 링크를 예측한다. 그러나 훈련 시 노드 콘텐츠(즉, 부가 정보)가 없을 경우, 추론 설정(inductive setting)에서는 사용자(또는 항목)별 표현을 학습할 수 없으며, 즉 특정 사용자(또는 항목) 그룹에 대해 훈련된 모델은 새로운 사용자(또는 항목)에 대해 적응할 수 없다. 이를 해결하기 위해 우리는 GAE를 활용한 추론형 행렬 완성 방법(IMC-GAE)을 제안한다. 본 방법은 GAE를 사용하여 개인화 추천을 위한 사용자별(또는 항목별) 표현과 추론형 행렬 완성에 적합한 국소 그래프 패턴을 동시에 학습한다. 구체적으로, 두 가지 정보성 있는 노드 특징을 설계하고 GAE 내에서 계층별 노드 드롭아웃 기법을 도입하여, 새로운 데이터에도 일반화 가능한 국소 그래프 패턴을 학습한다. 본 연구의 주요 기여는 기존의 GNN 기반 행렬 완성 방법에 비해 우수한 확장성과 뛰어난 표현력을 갖춘 GAE 내에서 효율적으로 국소 그래프 패턴을 학습할 수 있다는 점이다. 또한, 광범위한 실험을 통해 제안 모델이 여러 행렬 완성 기준 데이터셋에서 최고 수준의 성능을 달성함을 입증하였다. 공식 코드는 공개되어 있으며 누구나 접근 가능하다.