2달 전

대규모 그래프에서의 귀납적 표현 학습

William L. Hamilton; Rex Ying; Jure Leskovec

초록

대규모 그래프에서 노드의 저차원 임베딩은 콘텐츠 추천부터 단백질 기능 식별에 이르는 다양한 예측 작업에서 매우 유용하게 입증되었습니다. 그러나 대부분의 기존 접근 방식은 임베딩 학습 시 그래프 내 모든 노드가 존재해야 합니다. 이러한 이전 접근 방식들은 본질적으로 전도적(transductive)이며, 미리 보지 못한 노드들에 자연스럽게 일반화되지 않습니다. 여기서 우리는 GraphSAGE를 제시합니다. GraphSAGE는 노드 특성 정보(예: 텍스트 속성)를 활용하여 효율적으로 미리 보지 못한 데이터의 노드 임베딩을 생성하는 일반적인 귀납적(inductive) 프레임워크입니다. 각 노드의 개별 임베딩을 학습하는 대신, 우리는 노드의 로컬 이웃에서 특성을 샘플링하고 집계하여 임베딩을 생성하는 함수를 학습합니다. 우리의 알고리즘은 세 가지 귀납적 노드 분류 벤치마크에서 강력한 기준선들을 능가합니다. 우리는 인용 및 Reddit 게시글 데이터를 기반으로 진화하는 정보 그래프에서 미리 보지 못한 노드의 카테고리를 분류하며, 다중 그래프 데이터셋인 단백질-단백질 상호작용을 사용하여 완전히 새로운 그래프에도 일반화되는 것을 보여줍니다.