12日前

距離拡張型グラフニューラルネットワークによるリンク予測

{Tao Qin, Lijun Wu, Shufang Xie, Yingce Xia, Boling Li}
要約

リンク予測は、グラフ内の2つの頂点の間にリンク(辺)が存在するかどうかを予測するという機械学習における古典的問題である。直感的に、現存する辺に沿って頂点uからvまで到達するのに長い距離を歩かなければならない場合、その間にリンクが存在する可能性は低く、逆もまた然りである。この知見に基づき、本研究ではグラフニューラルネットワーク(GNN)に距離情報を明示的に組み込むことで、リンク予測の性能を向上させる手法を提案する。訓練中に任意の2頂点間の距離(例えば最短経路距離、ランダムウォークの期待値など)を計算することは、計算コストが非常に高い。この課題を克服するため、本研究では「アンカーベースの距離」を導入する。まず、グラフからランダムにK個のアンカーノードを抽出し、グラフ内のすべての頂点からこれらのアンカーノードまでの最短距離を計算する。その後、頂点uとvの間の距離を、それぞれのアンカーノードまでの距離の平均値として推定する。この距離情報をGNNモジュールに入力することで、追加パラメータが極めて少ない状態でリンク予測性能を著しく向上させた。本手法は、OGB(Huら、2020)の薬物-薬物相互作用(DDI)およびタンパク質-タンパク質相互作用(PPA)タスクにおいて、最先端の性能を達成した。実装コードは以下のURLから公開されている:https://github.com/lbn187/DLGNN。

距離拡張型グラフニューラルネットワークによるリンク予測 | 最新論文 | HyperAI超神経