2달 전
대규모 비동질 그래프 학습: 새로운 벤치마크와 강력한 단순 방법
Derek Lim; Felix Hohne; Xiuyu Li; Sijia Linda Huang; Vaishnavi Gupta; Omkar Bhalerao; Ser-Nam Lim

초록
많은 그래프 머신 러닝 작업에 사용되는 데이터셋들은 일반적으로 동질성(homophily)을 보였습니다. 즉, 유사한 라벨을 가진 노드들이 서로 연결되어 있었습니다. 최근에는 동질성 범위를 넘어서는 새로운 그래프 신경망(GNNs)이 개발되었지만, 이들의 평가는 종종 작은 그래프와 제한된 응용 분야에서 이루어졌습니다. 우리는 다양한 응용 분야에서 수집하고 소개하는 비동질성(non-homophilous) 데이터셋들을 제시합니다. 이러한 데이터셋들은 기존 데이터셋보다 최대 384배 더 많은 노드와 1398배 더 많은 엣지를 포함하고 있습니다. 또한, 기존의 확장 가능한 그래프 학습 및 그래프 미니배치 기술이 이러한 비동질성 데이터셋에서 성능 저하를 초래함을 보여주어, 확장 가능한 비동질성 방법에 대한 추가 연구의 필요성을 강조합니다. 이러한 문제를 해결하기 위해, LINKX라는 간단하면서도 강력한 방법을 소개합니다. LINKX는 직관적인 미니배치 훈련과 추론을 가능하게 합니다. 제안된 데이터셋들에 대한 대표적인 간단한 방법들과 GNNs의 광범위한 실험 결과를 통해 LINKX가 비동질성 그래프 학습에서 최고 수준의 성능을 달성함을 확인할 수 있습니다. 우리의 코드와 데이터는 https://github.com/CUAI/Non-Homophily-Large-Scale 에서 제공됩니다.