Halbüberwachte Graphklassifikation: Eine hierarchische Graphperspektive

Knotenklassifikation und Graphklassifikation sind zwei Probleme des Graphenlernens, die jeweils die Klassifikationsbezeichnung eines Knotens und die Klassifikationsbezeichnung eines Graphen vorhersagen. Ein Knoten in einem Graphen stellt in der Regel eine reale Entität dar, z.B. einen Benutzer in einem sozialen Netzwerk oder ein Protein in einem Protein-Protein-Interaktionsnetzwerk. In dieser Arbeit betrachten wir eine herausforderndere, aber praktisch nützliche Einstellung, bei der ein Knoten selbst eine Grapheninstanz ist. Dies führt zu einer hierarchischen Graphperspektive, die in vielen Bereichen wie sozialen Netzwerken, biologischen Netzwerken und Dokumentensammlungen auftritt. Zum Beispiel bildet in einem sozialen Netzwerk eine Gruppe von Menschen mit gemeinsamen Interessen eine Benutzergruppe, während mehrere Benutzergruppen durch Interaktionen oder gemeinsame Mitglieder miteinander verbunden sind. Wir untersuchen das Problem der Knotenklassifikation in einem hierarchischen Graphen, bei dem ein „Knoten“ eine Grapheninstanz ist, z.B. eine Benutzergruppe im obigen Beispiel. Da Labels in realweltlichen Daten oft begrenzt sind, entwickeln wir zwei neuartige semisupervisierte Lösungen namens \underline{SE}mi-supervised gr\underline{A}ph c\underline{L}assification via \underline{C}autious/\underline{A}ctive \underline{I}teration (kurz SEAL-C/AI). SEAL-C/AI verwenden ein iteratives Framework, das abwechselnd zwei Klassifizierer erstellt oder aktualisiert: einen am Level der Grapheninstanzen und den anderen am Level des hierarchischen Graphen. Um die Darstellung des hierarchischen Graphen zu vereinfachen, schlagen wir eine neuartige überwachte, selbst-merksamkeitsbasierte Graphenebettungsmethode vor, die SAGE genannt wird. Diese Methode kodiert beliebig große Grapheninstanzen in Vektoren fester Länge. Durch Experimente mit synthetischen Daten und Tencent QQ-Gruppendaten zeigen wir, dass SEAL-C/AI nicht nur hinsichtlich Genauigkeit/Macro-F1 erheblich bessere Ergebnisse als vergleichbare Methoden erzielen, sondern auch sinnvolle Interpretationen der gelernten Darstellungen generieren.