Distantly Supervised Relation Extraction mit Satzrekonstruktion und Wissensbasis-Priorisierung

Wir schlagen einen mehraufgabenbasierten, probabilistischen Ansatz vor, um die entfernt überwachte Relationsextraktion zu erleichtern, indem die Darstellungen von Sätzen, die dieselben Wissensbasen-Paare enthalten, näher zusammengeführt werden. Dazu beeinflussen wir den latente Raum von Sätzen mittels eines Variationalen Autoencoders (VAE), der gemeinsam mit einem Relationklassifikator trainiert wird. Der latente Code leitet die Paardarstellungen an und beeinflusst die Rekonstruktion der Sätze. Experimentelle Ergebnisse auf zwei über entfernte Überwachung generierten Datensätzen zeigen, dass das Mehraufgabenlernen zu Leistungsverbesserungen führt. Eine zusätzliche Untersuchung zur Einbindung von Wissensbasen-Priorwissen in den VAE ergab, dass der Satzraum in Richtung des Wissensbasenraums verschoben werden kann, was sowohl eine erhöhte Interpretierbarkeit als auch weitere Leistungssteigerungen ermöglicht.