Command Palette
Search for a command to run...
Neuüberlegung von Graphen-Autoencoder-Modellen für attributierte Graphen-Clustering
Neuüberlegung von Graphen-Autoencoder-Modellen für attributierte Graphen-Clustering
Nairouz Mrabah Mohamed Bouguessa Mohamed Fawzi Touati Riadh Ksantini
Zusammenfassung
Die meisten jüngsten Ansätze zur Graph-Clustering-Methodik setzen auf Graphen-Autoencoder (GAEs), um gemeinsam Clustering und Embedding-Lernung durchzuführen. Dabei wurden jedoch zwei kritische Probleme bisher übersehen. Erstens führt der akkumulierte Fehler, verursacht durch das Lernen mit verrauschten Clustering-Zuweisungen, zu einer Verschlechterung der Wirksamkeit und Robustheit des Clustering-Modells. Dieses Phänomen wird als Feature Randomness bezeichnet. Zweitens zwingt die Rekonstruktion der Adjazenzmatrix das Modell, irrelevanten Ähnlichkeiten für die Clustering-Aufgabe zu lernen. Dieses Problem wird als Feature Drift bezeichnet. Interessanterweise wurde bisher noch keine theoretische Verbindung zwischen diesen beiden Problemen untersucht. Wir analysieren diese Frage aus zwei Perspektiven: (1) Es besteht ein Kompromiss zwischen Feature Randomness und Feature Drift, wenn Clustering und Rekonstruktion auf derselben Ebene durchgeführt werden, und (2) das Problem der Feature Drift ist bei GAE-Modellen gegenüber herkömmlichen Autoencoder-Modellen deutlich ausgeprägter, was auf die graphenkonvolutionale Operation und die spezifische graphische Dekodierungsarchitektur zurückzuführen ist. Ausgehend von diesen Erkenntnissen reformulieren wir die GAE-basierte Clustering-Methodik. Unser Ansatz ist zweigeteilt: Erstens schlagen wir einen Sampling-Operator Ξ vor, der einen Schutzmechanismus gegen verrauschte Clustering-Zuweisungen aktiviert. Zweitens präsentieren wir einen Operator Υ, der einen Korrekturmechanismus gegen Feature Drift einleitet, indem er die rekonstruierte Graphenstruktur schrittweise in eine clusterausgerichtete Form überführt. Als zentrale Vorteile bietet unsere Lösung eine erhebliche Verbesserung der Clustering-Wirksamkeit und -Robustheit und lässt sich problemlos auf bestehende GAE-Modelle anpassen.