Robuste Optimierung als Daten-Augmentation für große Graphen

Die Datenaugmentierung unterstützt die bessere Generalisierung von neuronalen Netzen durch Vergrößerung des Trainingsdatensatzes, doch bleibt unklar, wie graphenbasierte Daten effektiv augmentiert werden können, um die Leistung von GNNs (Graph Neural Networks) zu verbessern. Während die meisten bestehenden Graph-Regularisierungsansätze darauf abzielen, die topologische Struktur des Graphen durch Hinzufügen oder Entfernen von Kanten zu manipulieren, präsentieren wir eine Methode zur Augmentierung von Knotenmerkmalen, um die Modellleistung zu steigern. Wir stellen FLAG (Free Large-scale Adversarial Augmentation on Graphs) vor, eine Methode, die während des Trainings iterativ Knotenmerkmale mit gradientenbasierten adversarialen Störungen augmentiert. Durch die Erzeugung von Invarianz gegenüber kleinen Schwankungen in den Eingabedaten unterstützt unsere Methode die Generalisierung auf außerhalb der Verteilung liegende (out-of-distribution) Beispiele und verbessert die Modellleistung im Testzeitraum. FLAG ist ein allgemein verwendbarer Ansatz für graphenbasierte Daten und funktioniert universell in Aufgaben der Knotenklassifikation, Link-Vorhersage und Graph-Klassifikation. Zudem ist FLAG äußerst flexibel und skalierbar und kann mit beliebigen GNN-Backbones sowie großen Datensätzen eingesetzt werden. Die Wirksamkeit und Stabilität unseres Ansatzes demonstrieren wir durch umfangreiche Experimente und Ablationsstudien. Zudem liefern wir intuitive Beobachtungen, die ein tieferes Verständnis unseres Verfahrens ermöglichen.