
摘要
许多具有图结构的数据满足同质性原则,即连接的节点在特定属性上往往相似。因此,用于图机器学习任务的普遍数据集通常表现出高度的同质性,这使得利用同质性作为归纳偏置的方法得到了奖励。近期的研究指出这一特定的关注点,随着新的非同质性数据集的引入以及更适合低同质性环境的图表示学习模型的发展,这一领域正在发生变化。然而,这些数据集规模较小,不太适合真正测试新方法在非同质性环境中的有效性。我们提出了一系列改进的图数据集,其中节点标签关系不满足同质性原则。同时,我们引入了一种新的衡量同质性存在与否的方法,该方法在不同情况下比现有方法更为适用。我们在提出的这些数据集上对一系列简单方法和图神经网络进行了基准测试,为后续研究提供了新的见解。相关数据和代码可以在 https://github.com/CUAI/Non-Homophily-Benchmarks 获取。