
네트워크의 노드와 엣지에 대한 예측 작업은 학습 알고리즘에서 사용되는 특징(feature)을 공학적으로 설계하는 데 신경을 써야 합니다. 최근 표현 학습(representation learning) 분야의 연구는 이러한 특징들을 직접 학습하여 예측을 자동화하는 데 큰 진전을 이루었습니다. 그러나 현재의 특징 학습 접근법은 네트워크에서 관찰되는 연결 패턴의 다양성을 포착하기에 충분히 표현력이 부족합니다. 이에 우리는 node2vec이라는 알고리즘 프레임워크를 제안합니다. 이 프레임워크는 네트워크 내 노드들의 근방 hood)를 보존할 가능성을 최대화하는 연속적인 특징 표현을 학습합니다.node2vec에서는 노드를 저차원 공간으로 매핑하여, 이 매핑이 네트워크 내 노드들의 근방을 보존할 가능성을 최대화하도록 학습됩니다. 우리는 유연한 노드의 네트워크 근방 개념을 정의하고, 다양한 근방을 효율적으로 탐색하는 편향된 무작위 행보(biased random walk) 절차를 설계하였습니다. 우리의 알고리즘은 기존 연구들이 고정된 네트워크 근방 개념에 기반한 것과 달리 이를 일반화하며, 우리는 근방 탐색에서 추가된 유연성이 더 풍부한 표현을 학습하는 데 중요한 역할을 한다고 주장합니다.우리는 node2vec이 다양한 분야에서 수집된 여러 실제 세계 네트워크에서 다중 라벨 분류(multi-label classification)와 링크 예측(link prediction) 작업에서 기존 최신 기술(state-of-the-art techniques)보다 우수함을 입증하였습니다. 종합적으로 보면, 우리의 연구는 복잡한 네트워크에서 효율적으로 최신 수준의 작업 독립적 표현(task-independent representations)을 학습하는 새로운 방법론을 제시합니다.