
초록
많은 그래프 구조를 가진 데이터는 동질성(homophily) 원칙을 만족합니다. 이 원칙은 연결된 노드가 특정 속성에 대해 유사할 경향이 있다는 것을 의미합니다. 따라서, 그래프 기계 학습 작업을 위한 일반적인 데이터셋들은 주로 높은 동질성을 가지고 있어, 동질성을 귀납적 편향으로 활용하는 방법론들을 보상해왔습니다. 최근 연구에서는 이러한 특정한 초점을 지적하며, 새로운 비동질성(non-homophilous) 데이터셋들이 소개되고, 낮은 동질성 환경에 더 적합한 그래프 표현 학습 모델들이 개발되었습니다. 그러나 이러한 데이터셋들은 작고, 새로운 방법론들의 비동질성 환경에서의 효과성을 진정으로 테스트하기에는 적절하지 않습니다. 우리는 동질성 원칙을 만족하지 않는 노드 라벨 관계를 가진 개선된 그래프 데이터셋 시리즈를 제시합니다. 또한, 기존의 측정 방법들보다 다양한 상황에서 더 적합한 새로운 동질성 존재 여부 측정 방법을 소개합니다. 우리는 제안된 데이터셋들에 걸쳐 다양한 단순 방법들과 그래프 신경망들을 벤치마킹하여, 추가 연구를 위한 새로운 통찰력을 제공합니다. 데이터와 코드는 https://github.com/CUAI/Non-Homophily-Benchmarks에서 확인할 수 있습니다.