2달 전
이진화된 속성 네트워크 임베딩
{Hong Yang, Chengqi Zhang, Shirui Pan, Ling Chen, Peng Zhang, Defu Lian}
초록
"이진화된 특성 네트워크 임베딩(Binarized Attributed Network Embedding)"의 구현체. 특성 네트워크 임베딩은 노드 간 연결성과 특성 정보를 동시에 표현 학습할 수 있도록 한다. 기존의 특성 네트워크 임베딩 모델은 일반적으로 연속적인 유클리드 공간에서 설계되어 있어 데이터의 중복성을 유발하고, 저장 및 계산 비용 측면에서 도전 과제를 야기한다. 이를 해결하기 위해 본 연구에서는 이진 노드 표현을 학습할 수 있는 이진화된 특성 네트워크 임베딩 모델(BANE, Binarized Attributed Network Embedding)을 제안한다. 구체적으로, 노드 간 연결성과 특성 간의 데이터 의존성을 캡처하기 위해, 계층적으로 인접 노드들의 특성 및 연결 정보를 대상 노드에 집계하는 방식으로 새로운 Weisfeiler-Lehman 근접성 행렬(Weisfeiler-Lehman proximity matrix)을 정의한다. 이 근접성 행렬을 기반으로, 이진 노드 표현 제약 조건 하에서 새로운 Weisfeiler-Lehman 행렬 분해 학습 함수를 제안한다. 이 학습 문제는 혼합 정수 최적화 문제이며, 효율적인 순환 좌표 강하(Cyclic Coordinate Descent, CCD) 알고리즘이 이를 해결하는 데 사용된다. 실제 데이터셋을 대상으로 한 노드 분류 및 링크 예측 실험 결과, 제안하는 BANE 모델이 최신 기술 수준의 네트워크 임베딩 방법들보다 우수한 성능을 보였다.