Entitätsausrichtung für Wissensgraphen mit mehrordnungsbasierten Faltungsnetzwerken
Wissensgraphen (KGs) sind zu beliebten Strukturen geworden, um reale Weltentitäten zu vereinheitlichen, indem sie die Beziehungen zwischen ihnen sowie deren Attribute modellieren. Die Entitätenausrichtung – die Aufgabe, entsprechende Entitäten in verschiedenen KGs zu identifizieren – hat sowohl in der akademischen Forschung als auch in der Industrie erhebliche Aufmerksamkeit gefunden. Allerdings erfordern bestehende Ausrichtungstechniken oft große Mengen an gelabelten Daten, können mehrmodale Daten nicht gleichzeitig kodieren und setzen nur wenige Konsistenzbedingungen durch. In diesem Artikel präsentieren wir einen end-to-end, unsupervisierten Rahmen für die Entitätenausrichtung in mehrsprachigen Wissensgraphen, der verschiedene Informationsarten fusioniert, um die Reichhaltigkeit von KG-Daten vollständig auszunutzen. Das Modell erfasst die relationenbasierte Korrelation zwischen Entitäten mittels eines mehrordnungsfähigen Graphen-Convolutional Neural Network (GCN), das speziell darauf ausgelegt ist, Konsistenzbedingungen zu erfüllen, während es gleichzeitig die attributbasierte Korrelation über eine Übersetzungs-Maschine integriert. Wir verwenden eine späte Fusion-Mechanismus, um sämtliche Informationen zusammenzuführen, was es den Ansätzen ermöglicht, sich gegenseitig zu ergänzen und somit die endgültige Ausrichtungsergebnisse zu verbessern, und gleichzeitig die Robustheit des Modells gegenüber Verletzungen von Konsistenzbedingungen erhöht. Experimentelle Ergebnisse zeigen, dass unser Modell genauer ist und um Größenordnungen schneller als bestehende Baselines arbeitet. Zudem demonstrieren wir dessen Empfindlichkeit gegenüber Hyperparametern, den Einsparungspotenzial bei der Datenannotation sowie die Robustheit gegenüber adversariellen Bedingungen.