11일 전

거리 증강 그래프 신경망을 이용한 링크 예측

{Tao Qin, Lijun Wu, Shufang Xie, Yingce Xia, Boling Li}
초록

링크 예측은 그래프 내 두 정점 사이에 링크(간선)가 존재할지를 예측하는 기계학습의 전통적인 문제이다. 직관적으로, 기존 간선을 따라 정점 u에서 v로 이동하는 데 긴 거리가 소요된다면, 두 정점 사이에는 링크가 존재하지 않을 가능성이 크며, 반대의 경우도 마찬가지이다. 이러한 직관을 바탕으로, 거리 정보를 그래프 신경망(GNN)과 명시적으로 결합하여 링크 예측 성능을 향상시키고자 한다. 그러나 훈련 과정에서 임의의 두 정점 사이의 거리(예: 최단 경로, 무작위 보행의 기대값 등)를 계산하는 것은 시간이 매우 오래 걸린다. 이러한 문제를 해결하기 위해, 우리는 '앵커 기반 거리(anchored-based distance)'를 제안한다. 먼저 그래프에서 무작위로 K개의 앵커 정점을 선택한 후, 그래프 내 모든 정점과의 최단 거리를 계산한다. 이후 정점 u와 v 사이의 거리는 이들 각각이 K개의 앵커 정점까지의 거리의 평균으로 추정한다. 이후 이 거리 정보를 GNN 모듈에 입력한다. 제안한 방법은 추가적인 파라미터 수가 거의 증가하지 않으면서도 링크 예측 성능에 상당한 향상을 가져왔다. 본 연구는 Hu 등(2020)이 제시한 OGB(Open Graph Benchmark)의 약물-약물 상호작용(DDI) 및 단백질-단백질 상호작용(PPA) 태스크에서 최고 성능을 달성하였다. 코드는 다음 링크에서 공개되어 있다: https://github.com/lbn187/DLGNN.

거리 증강 그래프 신경망을 이용한 링크 예측 | 최신 연구 논문 | HyperAI초신경