Ein flexibles generatives Framework für graphbasiertes semisupervises Lernen

Wir betrachten eine Klasse von Problemen, die sich mit der Vorhersage für den Großteil nicht gekennzeichneter, graphstrukturierter Datenbeispiele auf Basis eines kleinen Anteils gekennzeichneter Beispiele befassen. Die relationalen Informationen zwischen den Datenbeispielen, die oft in der Graph-/Netzwerkstruktur kodiert sind, erweisen sich als hilfreich für diese semiaufgeklärten Lernaufgaben (semi-supervised learning tasks). Allerdings nutzen herkömmliche graphbasierte Regularisierungsmethoden und aktuelle Graphneuronale Netze (Graph Neural Networks) die Interrelationen zwischen den Merkmalen (features), dem Graphen und den Klassenlabels nicht vollständig aus. In dieser Arbeit schlagen wir ein flexibles generatives Framework für graphbasiertes semiaufgeklärtes Lernen vor, das die gemeinsame Verteilung der Knotenmerkmale, Klassenlabels und der Graphstruktur anspricht. Indem wir Erkenntnisse aus Modellen zufälliger Graphen in der Netzwerkwissenschaftliteratur einbeziehen, kann diese gemeinsame Verteilung durch verschiedene Verteilungsfamilien instanziiert werden. Für die Inferenz fehlender Labels nutzen wir jüngste Fortschritte skalierbarer variationsanalytischer Inferenzmethoden (scalable variational inference techniques), um das bayesianische A-posteriori zu approximieren. Wir führen umfassende Experimente auf Benchmark-Datensätzen für graphbasiertes semiaufgeklärtes Lernen durch. Die Ergebnisse zeigen, dass die vorgeschlagenen Methoden in den meisten Szenarien den Stand der Technik übertreffen.