HyperAIHyperAI
vor 2 Monaten

Mehrsprachige Wissensgraphen-Einbettungen für die cross-linguale Wissenalignment

Muhao Chen; Yingtao Tian; Mohan Yang; Carlo Zaniolo
Mehrsprachige Wissensgraphen-Einbettungen für die cross-linguale Wissenalignment
Abstract

Viele kürzliche Arbeiten haben die Vorteile von Wissensgraphen-Embeddungen bei der Vervollständigung monolingualer Wissensgraphen gezeigt. Da verwandte Wissensbasen in mehreren verschiedenen Sprachen erstellt werden, wird die cross-linguale Wissensausrichtung helfen, eine kohärente Wissensbasis aufzubauen, und Maschinen dabei unterstützen, unterschiedliche Ausdrucksformen von Entitätsbeziehungen in diversen menschlichen Sprachen zu verarbeiten. Leider ist die Erreichung dieser hoch angestrebten cross-lingualen Ausrichtung durch menschliche Arbeit sehr kostspielig und fehleranfällig. Daher schlagen wir MTransE vor, ein translationsbasiertes Modell für multilinguale Wissensgraphen-Embeddungen, das eine einfache und automatisierte Lösung bietet. Durch die Kodierung von Entitäten und Beziehungen jeder Sprache in einem separaten Embedding-Raum bietet MTransE Übergänge für jeden Embedding-Vektor zu seinen cross-lingualen Gegenstücken in anderen Räumen, wobei es die Funktionalität der monolingualen Embeddungen beibehält. Wir verwenden drei verschiedene Techniken zur Darstellung der cross-lingualen Übergänge: Achsenkalibrierung (axis calibration), Translationsvektoren (translation vectors) und lineare Transformationen (linear transformations), und leiten fünf Varianten von MTransE ab, indem wir unterschiedliche Verlustfunktionen verwenden. Unsere Modelle können auf teilweise ausgerichteten Graphen trainiert werden, bei denen nur ein kleiner Teil der Tripel mit ihren cross-lingualen Gegenstücken ausgerichtet ist. Die Experimente zur cross-lingualen Entitätsabgleichung und zur Verifizierung der Triple-Ausrichtung zeigen vielversprechende Ergebnisse, wobei einige Varianten bei verschiedenen Aufgaben stets bessere Leistungen erzielen als andere. Wir untersuchen auch, wie MTransE die wesentlichen Eigenschaften seines monolingualen Pendant TransE bewahrt.

Mehrsprachige Wissensgraphen-Einbettungen für die cross-linguale Wissenalignment | Neueste Forschungsarbeiten | HyperAI