End-to-End Relationsextraktion unter Verwendung von LSTMs in Sequenzen und Baumstrukturen

Wir präsentieren ein neues, von Anfang bis Ende konzipiertes neuronales Modell zur Extraktion von Entitäten und den Beziehungen zwischen ihnen. Unser auf rekurrenten neuronalen Netzen basierendes Modell erfasst sowohl die Wortfolge als auch die Abhängigkeitsbaumunterstrukturinformationen, indem es bidirektionale baumstrukturierte LSTM-RNNs auf bidirektionale sequentielle LSTM-RNNs stapelt. Dies ermöglicht es unserem Modell, Entitäten und Beziehungen mit geteilten Parametern in einem einzigen Modell gemeinsam darzustellen. Während des Trainings fördern wir zudem die Erkennung von Entitäten und nutzen Informationen über Entitäten bei der Beziehungsextraktion durch Vorab-Training von Entitäten und geplantes Sampling. Unser Modell verbessert sich im Vergleich zum aktuellen Stand der Technik bei featurebasierten Modellen in der von Anfang bis Ende durchgeführten Beziehungsextraktion, wobei es eine relative Fehlerreduzierung von 12,1 % und 5,7 % im F1-Score auf ACE2005 und ACE2004 jeweils erreicht. Zudem zeigen wir, dass unser LSTM-RNN-basiertes Modell sich günstig mit dem CNN-basierten Modell des aktuellen Standes der Technik (im F1-Score) bei der Klassifikation nominaler Beziehungen (SemEval-2010 Task 8) vergleicht. Schließlich präsentieren wir eine umfassende Ablationsanalyse verschiedener Modellkomponenten.