15일 전

커뮤니티 표현과 노드 표현 사이의 격차를 메우기: 커뮤니티 탐지에 의한 그래프 임베딩

Artem Lutov, Dingqi Yang, Philippe Cudré-Mauroux
커뮤니티 표현과 노드 표현 사이의 격차를 메우기: 커뮤니티 탐지에 의한 그래프 임베딩
초록

그래프 임베딩은 많은 데이터 마이닝 및 분석 시스템의 핵심 구성 요소로 자리 잡았다. 기존의 그래프 임베딩 기법들은 일반적으로 확률적 최적화를 통해 노드 임베딩을 학습하기 위해 그래프에서 대량의 노드 쌍을 샘플링하거나, 계산 비용이 매우 높은 행렬 분해 기법을 사용하여 그래프의 고차원 근접성/인접 행렬을 분해한다. 이러한 접근 방식은 학습 과정에 상당한 자원을 요구하며, 여러 파라미터에 의존하기 때문에 실용적인 적용에 한계가 있다. 또한 대부분의 기존 그래프 임베딩 기법은 특정한 거리 측정 공간(예: 코사인 유사도로 생성된 공간)에서만 효과적으로 작동하며, 입력 그래프의 고차원 구조적 특성을 유지하지 못하고, 의미 있는 임베딩 차원 수를 자동으로 결정할 수 없다. 일반적으로 생성된 임베딩은 해석하기 어렵기 때문에, 이후 분석을 복잡하게 만들고 적용 범위를 제한한다. 이러한 문제를 해결하기 위해 우리는 매개변수 없이 매우 효율적인 그래프 임베딩 기법 DAOR를 제안한다. DAOR는 수동 조정 없이 메트릭 공간에 강건하고, 컴팩트하며 해석 가능한 임베딩을 생성한다. 기존의 수십 가지 최첨단 그래프 임베딩 알고리즘과 비교했을 때, DAOR는 고차원 근접성에 유리한 노드 분류와 주로 저차원 근접성에 의존하는 링크 예측 모두에서 경쟁력 있는 성능을 보인다. 그러나 기존 기법들과 달리 DAOR는 어떤 형태의 파라미터 조정도 필요 없으며, 임베딩 생성 속도를 수개의 주문 이상으로 향상시킨다. 따라서 본 연구의 접근법은 그래프 표현 학습을 포함하는 데이터 분석 작업을 크게 단순화하고 가속화하는 것을 목표로 한다.

커뮤니티 표현과 노드 표현 사이의 격차를 메우기: 커뮤니티 탐지에 의한 그래프 임베딩 | 최신 연구 논문 | HyperAI초신경