Verbesserung der Relationsextraktion mithilfe syntaktischer Indikatoren und satzlicher Kontexte

Zustandsbestimmende Methoden zur Relationsextraktion berücksichtigen den satzweisen Kontext, indem sie den gesamten Satz modellieren. Dennoch enthalten syntaktische Indikatoren – bestimmte Phrasen oder Wörter wie Präpositionen – oft informativere Signale als andere Wörter und können somit zur Identifizierung semantischer Relationen von Vorteil sein. Andere Ansätze, die feste Textauslöser verwenden, erfassen solche Informationen, ignorieren jedoch die lexikalische Vielfalt. Um sowohl syntaktische Indikatoren als auch den satzweisen Kontext zu nutzen, schlagen wir einen indikatorbewussten Ansatz zur Relationsextraktion vor. Zunächst extrahieren wir syntaktische Indikatoren unter Anleitung syntaktischer Kenntnisse. Anschließend konstruieren wir ein neuronales Netzwerk, das sowohl syntaktische Indikatoren als auch den gesamten Satz zur Erzeugung verbesserter Relationenrepräsentationen integriert. Auf diese Weise verringert das vorgeschlagene Modell die Auswirkung von störenden Informationen aus dem gesamten Satz und überwindet die Beschränkung durch feste Textauslöser. Experimente auf dem SemEval-2010 Task 8 Benchmark-Datensatz zeigen, dass unser Modell die state-of-the-art-Methoden signifikant übertrifft.