레이블링 트릭: 다중 노드 표현 학습을 위한 그래프 신경망 이론

본 논문에서는 그래프 신경망(GNN)을 다중 노드 표현 학습(여러 개의 노드 집합, 예를 들어 링크에 대한 표현을 학습하는 것)에 사용하기 위한 이론을 제공합니다. GNN은 단일 노드 표현을 학습하도록 설계되었습니다. 여러 노드가 포함된 노드 집합 표현을 학습하려 할 때, 이전 연구에서는 GNN으로 얻은 단일 노드 표현들을 직접 결합하여 공동 노드 집합 표현을 생성하는 것이 일반적인 방법이었습니다. 본 논문에서는 이러한 접근 방식의 근본적인 제약, 즉 노드 집합 내의 노드들 간의 의존성을 포착할 수 없는 문제를 보여주고, 개별 노드 표현들을 직접 결합하는 것이 다중 노드에 대한 효과적인 공동 표현으로 이어지지 않는다는 주장을 제시합니다.그런 다음, 우리는 다중 노드 표현 학습에서 성공한 몇몇 이전 연구들, 예를 들어 SEAL, 거리 인코딩(Distance Encoding), 그리고 ID-GNN 등이 모두 노드 라벨링을 사용했다는 점에 주목합니다. 이러한 방법들은 먼저 그래프 내의 노드들을 대상 노드 집합과의 관계에 따라 라벨링한 후 GNN을 적용합니다. 그런 다음, 라벨링된 그래프에서 얻은 노드 표현들이 공동으로 결합되어 노드 집합 표현을 형성합니다. 이러한 방법들의 내부 메커니즘을 조사함으로써, 우리는 이러한 모든 노드 라벨링 기법들을 가장 일반적이고 통일된 형태인 '라벨링 트릭'으로 통합하였습니다.우리는 충분히 표현력 있는 GNN이 라벨링 트릭을 통해 가장 강력한 노드 집합 표현을 학습할 수 있으며, 원칙적으로는 어떤 공동 학습 작업이라도 해결할 수 있다는 것을 증명하였습니다. 링크 예측이라는 중요한 두 개의 노드 표현 학습 작업에서 수행한 실험 결과가 우리의 이론을 검증하였습니다. 본 연구는 이전의 라벨링 기반 방법들의 우수한 성능을 설명하고, GNN을 이용한 다중 노트 표현 학습의 이론적 기초를 확립하였습니다.