Die Entkoppelung von Homophilie und Heterophilie in der halbüberwachten Knotenklassifikation

Kürzlich haben Graph Neural Networks (GNNs) aufgrund der Nutzung von Wissen aus Graphdatenbanken eine herausragende Leistung bei der halbüberwachten Knotenklassifikation gezeigt. Allerdings folgen die meisten bestehenden GNNs der Homophilie-Annahme, gemäß derer verbundene Knoten tendenziell ähnliche Merkmalsverteilungen und dieselben Labels aufweisen. Diese Annahme hat sich jedoch in einer wachsenden Anzahl praktischer Anwendungen als anfällig erwiesen. Als Ergänzung dazu wird Heterophilie betrachtet, die eine Ungleichartigkeit zwischen verbundenen Knoten widerspiegelt und in der Graph-Lernforschung zunehmend Aufmerksamkeit erfährt. Ziel der Dateningenieure ist daher die Entwicklung eines leistungsfähigen GNN-Modells, das sowohl unter Homophilie als auch unter Heterophilie eine hohe Leistung erzielt. Trotz zahlreicher Anstrengungen leiden die meisten bestehenden GNNs aufgrund der Beschränkungen ungerichteter Graphen weiterhin unter suboptimalen Knotenrepräsentationen. Die Vernachlässigung gerichteter Kanten führt zu suboptimalen Graphrepräsentationen und behindert somit die Fähigkeit von GNNs. Um dieses Problem anzugehen, führen wir AMUD ein, das die Beziehung zwischen Knotenprofilen und Topologie statistisch quantifiziert und wertvolle Erkenntnisse für die adaptivere Modellierung natürlicher gerichteter Graphen als ungerichtete oder gerichtete Graphen liefert, um die Vorteile für nachfolgende Graph-Lernprozesse zu maximieren. Darüber hinaus stellen wir Adaptive Directed Pattern Aggregation (ADPA) als ein neues Paradigma für die Gerichtete-Graph-Lernung im Rahmen von AMUD vor. Empirische Studien haben gezeigt, dass AMUD eine effiziente Graph-Lernung ermöglicht. Zudem belegen umfangreiche Experimente an 16 Benchmark-Datensätzen die beeindruckende Leistungsfähigkeit von ADPA, das die Baseline-Modelle mit einer signifikanten Verbesserung von 3,96 Prozent übertrifft.