Multilinguale Wissensgraphen-Vervollständigung mit selbstüberwachter adaptiver Graphenalignment

Die Vorhersage fehlender Fakten in einem Wissensgraphen (KG) ist entscheidend, da moderne Wissensgraphen weit von Vollständigkeit entfernt sind. Aufgrund der aufwändigen menschlichen Annotation verschärft sich dieses Problem insbesondere bei der Verarbeitung von Wissen in verschiedenen Sprachen. In diesem Paper untersuchen wir die mehrsprachige Vervollständigung von Wissensgraphen, die begrenzte Seed-Alignment als Brücke nutzt, um das kollektive Wissen mehrerer Sprachen zu erschließen. Allerdings wird die Sprachalignment in vorangegangenen Arbeiten noch nicht ausreichend genutzt: (1) werden Alignmentschritte gleichwertig behandelt, um parallele Entitäten maximal zu nahe zu bringen, was die unterschiedliche Kapazität der einzelnen KGs ignoriert; (2) ist die Seed-Alignment knapp, und die Identifikation neuer Alignments erfolgt meist in einer verrauschten, unsupervisierten Weise. Um diese Herausforderungen zu bewältigen, schlagen wir eine neuartige selbstüberwachte adaptive Graph-Alignment-Methode (SS-AGA) vor. Konkret integriert SS-AGA alle KGs zu einem einzigen Gesamtgraphen, indem Alignment als eine neue Kantenart betrachtet wird. Dadurch können Informationsweiterleitung und Rauscheinfluss zwischen den KGs über relationenbewusste Aufmerksamkeitsgewichte adaptiv gesteuert werden. Gleichzeitig verfügt SS-AGA über einen neuen Paar-Generator, der potenzielle Alignmentschritte in einer selbstüberwachten Paradigma dynamisch erfasst. Umfassende Experimente sowohl auf dem öffentlichen mehrsprachigen DBpedia-KG als auch auf dem neu erstellten industriellen mehrsprachigen E-Commerce-KG belegen empirisch die Wirksamkeit von SS-AGA.