2달 전

LINE: 대규모 정보 네트워크 임베딩

Jian Tang; Meng Qu; Mingzhe Wang; Ming Zhang; Jun Yan; Qiaozhu Mei
LINE: 대규모 정보 네트워크 임베딩
초록

본 논문은 시각화, 노드 분류, 링크 예측 등 다양한 작업에 유용한 대규모 정보 네트워크를 저차원 벡터 공간에 임베딩하는 문제를 연구합니다. 기존의 대부분 그래프 임베딩 방법들은 실제 세계의 정보 네트워크, 즉 수백만 개의 노드를 포함하는 네트워크에 확장성이 부족합니다. 본 논문에서는 이러한 제약을 극복하고 무방향, 유방향, 가중치가 있는 등의 임의 형태의 정보 네트워크에 적합한 새로운 네트워크 임베딩 방법인 "LINE"을 제안합니다. 이 방법은 지역적 구조와 전역적 구조를 모두 보존하도록 설계된 목적 함수를 최적화합니다. 또한 클래식 스토캐스틱 그래디언트 디센트의 한계를 해결하고 추론의 효과성과 효율성을 향상시키는 엣지 샘플링 알고리즘을 제안합니다. 경험적인 실험 결과는 언어 네트워크, 사회 네트워크, 인용 네트워크 등 다양한 실제 세계 정보 네트워크에서 LINE의 효과성을 입증하였습니다. 이 알고리즘은 매우 효율적이며, 일반적인 단일 머신에서 수백만 개의 정점과 수십억 개의 엣지를 가진 네트워크의 임베딩을 몇 시간 안에 학습할 수 있습니다. LINE의 소스 코드는 온라인으로 제공됩니다.

LINE: 대규모 정보 네트워크 임베딩 | 최신 연구 논문 | HyperAI초신경