8일 전

GEMSEC: 자체 클러스터링을 이용한 그래프 임베딩

{Ryan Davies, Benedek Rozemberczki, Charles Sutton, Rik Sarkar}
GEMSEC: 자체 클러스터링을 이용한 그래프 임베딩
초록

현대의 그래프 임베딩 기법은 수백만 개의 노드를 가진 그래프에서 노드의 특징을 효율적으로 추출할 수 있다. 이러한 특징은 이후 예측 작업에 입력으로 사용된다. 본 논문에서는 노드의 특징을 계산하는 동시에 노드의 군집화를 동시에 학습하는 그래프 임베딩 알고리즘인 GEMSEC을 제안한다. 이 알고리즘은 추상적인 특징 공간 내에서 노드를 배치하며, 이 공간에서 노드의 특징은 샘플링된 정점 이웃 관계를 보존하는 데 필요한 음의 로그 가능도를 최소화하도록 설계된다. 동시에 이 공간 내에서 노드들은 고정된 수의 그룹으로 군집화된다. GEMSEC은 이전의 관련 연구를 일반화한 확장된 방법으로, 시퀀스 기반 그래프 임베딩 기법의 핵심 최적화 문제에 대한 보완을 제공하며, 이웃 샘플링 전략에 독립적이다. 우리는 GEMSEC이 실제 사회 네트워크에서 높은 품질의 군집을 추출하며, 다른 커뮤니티 탐지 알고리즘과 경쟁력을 갖는다는 것을 보여준다. 또한 군집 제약이 표현 품질에 긍정적인 영향을 미친다는 점을 입증하고, 본 방법이 그래프의 임베딩과 군집화를 견고하고 확장 가능한 방식으로 공동으로 학습함을 보였다.