Abstandsverstärktes Graphennetzwerk für die Link-Vorhersage
Die Linkvorhersage, also die Vorhersage der Existenz einer Verbindung/Kante zwischen zwei Knoten in einem Graphen, ist ein klassisches Problem im maschinellen Lernen. Intuitiv sollte es unwahrscheinlich sein, dass zwischen zwei Knoten u und v eine Kante existiert, wenn der Pfad entlang der vorhandenen Kanten zwischen ihnen sehr lang ist, und umgekehrt. Dies motiviert uns, die Distanzinformation explizit mit Graph Neural Networks (GNNs) zu kombinieren, um die Leistung der Linkvorhersage zu verbessern. Die Berechnung der Distanzen zwischen beliebigen Knotenpaaren (z. B. kürzester Pfad, Erwartungswert eines zufälligen Walks) während des Trainings ist jedoch zeitaufwendig. Um diesem Problem zu begegnen, schlagen wir eine ankerbasierte Distanz vor: Zunächst wählen wir zufällig K Ankerknoten aus dem Graphen aus und berechnen dann die kürzesten Distanzen aller Knoten im Graphen zu diesen Ankerknoten. Die Distanz zwischen zwei Knoten u und v wird als Durchschnitt ihrer Distanzen zu den K Ankerknoten geschätzt. Anschließend wird diese Distanz in das GNN-Modul eingespeist. Unser Ansatz führt zu einer erheblichen Verbesserung der Linkvorhersage mit nur wenigen zusätzlichen Parametern. Wir erreichen einen state-of-the-art-Ergebnis auf den Aufgaben Drogen-Drogen-Interaktion (DDI) und Protein-Protein-Assoziation (PPA) des OGB-Datensatzes (Hu et al., 2020). Der Quellcode ist unter https://github.com/lbn187/DLGNN verfügbar.