속성 다중 이질 네트워크를 위한 표현 학습

네트워크 임베딩(또는 그래프 임베딩)은 많은 실제 응용 분야에서 널리 사용되고 있습니다. 그러나 기존 방법들은 주로 단일 유형의 노드/엣지에 초점을 맞추고 있으며, 대규모 네트워크를 처리하는 데 있어서 잘 확장되지 않는다는 문제가 있습니다. 많은 실제 네트워크는 수십억 개의 노드와 여러 유형의 엣지로 구성되며, 각 노드는 다양한 속성과 연결되어 있습니다. 본 논문에서는 속성 다중 이질적 네트워크(Attributed Multiplex Heterogeneous Network)에 대한 임베딩 학습 문제를 체계화하고, 이 문제를 해결하기 위한 통합 프레임워크를 제안합니다. 이 프레임워크는 전도적(transductive) 학습과 귀납적(inductive) 학습을 모두 지원합니다. 또한 제안된 프레임워크의 이론적 분석을 제공하여, 이전 연구들과의 관련성을 보여주고 그 우수한 표현력을 증명합니다. 우리는 아마존, 유튜브, 트위터, 알리바바 등 네 가지 다른 장르의 도전적인 데이터셋에서 제안된 프레임워크를 체계적으로 평가했습니다. 실험 결과는 제안된 프레임워크에서 학습된 임베딩을 사용하면 링크 예측/link prediction에서 기존 최신 방법들보다 통계적으로 유의미한 향상(F1 점수로 5.99-28.23% 향상; p<<0.01, t-검정)을 달성할 수 있음을 보여줍니다. 또한 이 프레임워크는 세계 최대 전자상거래 회사인 알리바바 그룹의 추천 시스템에 성공적으로 배포되었습니다. 제품 추천에 대한 오프라인 A/B 테스트 결과는 실무에서 프레임워크의 효과성과 효율성을 더욱 확인해주었습니다.