Induktive Matrix-Vervollständigung mithilfe eines Graphen-Autoencoders

Kürzlich hat das Graph Neural Network (GNN) erhebliches Potenzial bei der Matrix-Vervollständigung gezeigt, indem es eine Bewertungsmatrix als bipartiten Graphen formuliert und anschließend die fehlenden Verbindungen zwischen den entsprechenden Benutzer- und Artikelknoten vorhersagt. Die überwiegende Mehrheit der auf GNN basierenden Methoden zur Matrix-Vervollständigung stützt sich auf den Graphen-Autoencoder (GAE), der als Eingabe die One-Hot-Indizes verwendet, diese Indizes in lernbare Embeddings abbildet, ein GNN einsetzt, um knotenspezifische Repräsentationen auf Basis dieser lernbaren Embeddings zu erlernen, und schließlich die Repräsentationen des Zielbenutzers und seines entsprechenden Artikelknotens aggregiert, um fehlende Verbindungen vorherzusagen. Allerdings kann im induktiven Setting, insbesondere ohne Knoteninhalte (d. h. zusätzliche Informationen), die knotenspezifische Repräsentation nicht erlernt werden – ein Modell, das auf einer Gruppe von Benutzern (oder Artikeln) trainiert wurde, ist nicht in der Lage, sich auf neue Benutzer (oder Artikel) anzupassen. Um dies zu beheben, schlagen wir eine induktive Methode zur Matrix-Vervollständigung mittels GAE (IMC-GAE) vor, die den GAE nutzt, um sowohl knotenspezifische Repräsentationen für personalisierte Empfehlungen als auch lokale Graphmuster für die induktive Matrix-Vervollständigung zu lernen. Konkret entwerfen wir zwei informativ gestaltete Knotenmerkmale und verwenden ein schichtweises Knoten-Dropout-Schema im GAE, um lokale Graphmuster zu lernen, die auf unbekannte Daten generalisierbar sind. Der Hauptbeitrag unserer Arbeit liegt in der Fähigkeit, lokale Graphmuster im GAE effizient zu lernen, wobei das Verfahren eine hervorragende Skalierbarkeit und überlegene Ausdruckskraft im Vergleich zu früheren GNN-basierten Ansätzen zur Matrix-Vervollständigung aufweist. Darüber hinaus zeigen umfangreiche Experimente, dass unser Modell auf mehreren Benchmark-Datenbanken für Matrix-Vervollständigung die aktuell besten Ergebnisse erzielt. Der offizielle Code unserer Implementierung ist öffentlich zugänglich.