
要約
多くのグラフ構造を持つデータは同質性の原則を満たしており、これは接続されたノードが特定の属性に関して類似する傾向があることを意味します。そのため、グラフ機械学習タスク用の一般的なデータセットは、同質性を誘導バイアスとして活用する方法に有利であることが多かったです。最近の研究では、この特定の焦点が指摘され、新しい非同質性データセットが導入され、低同質性環境に適したグラフ表現学習モデルが開発されています。しかし、これらのデータセットは小さく、新しい手法の非同質性環境における有効性を真にテストするのに適していない場合があります。本稿では、同質性の原則を満たさないノードラベル関係を持つ一連の改善されたグラフデータセットを提示します。また、既存の測定方法よりも異なる状況でより適している新しい同質性の存在または不存在を測定する方法も紹介します。我々は提案したデータセットに対して一連の単純な手法とグラフニューラルネットワークをベンチマーク評価し、さらなる研究のために新たな洞察を得ています。データとコードは以下のURLから入手できます: https://github.com/CUAI/Non-Homophily-Benchmarks.