Klassifizierung von Beziehungen mittels Long Short Term Memory-Netzwerken entlang des kürzesten Abhängigkeitspfads

Die Relationenklassifikation ist ein wichtiger Forschungsbereich im Bereich der natürlichen Sprachverarbeitung (NLP). In dieser Arbeit stellen wir SDP-LSTM vor, ein neues neuronales Netzwerk zur Klassifizierung der Beziehung zwischen zwei Entitäten in einem Satz. Unsere neuronale Architektur nutzt den kürzesten Abhängigkeitspfad (SDP) zwischen zwei Entitäten; mehrkanalige rekurrente Neuronennetze mit Long Short-Term Memory (LSTM)-Einheiten erfassen entlang des SDP heterogene Informationen. Das von uns vorgeschlagene Modell weist mehrere charakteristische Merkmale auf: (1) Die kürzesten Abhängigkeitspfade behalten die meisten relevanten Informationen bei (für die Relationenklassifikation), während sie irrelevante Wörter im Satz eliminieren. (2) Die mehrkanaligen LSTM-Netze ermöglichen eine effektive Informationsintegration aus heterogenen Quellen über die Abhängigkeitspfade. (3) Eine angepasste Dropout-Strategie regularisiert das neuronale Netzwerk, um Überanpassung zu reduzieren. Wir testen unser Modell anhand der SemEval 2010 Relationenklassifikationsaufgabe und erreichen einen $F_1$-Wert von 83,7\%, was höher ist als die Werte konkurrierender Methoden in der Literatur.