Namensentitätenerkennung und Relationserkennung mittels verbesserter Tabellenfüllung durch kontextualisierte Darstellungen

In dieser Studie wird eine neuartige Methode zur Extraktion von benannten Entitäten und Relationen aus unstrukturiertem Text vorgestellt, die auf einer Tabellenrepräsentation basiert. Durch den Einsatz kontextualisierter Wortembeddings berechnet die vorgeschlagene Methode Darstellungen für Entitätenmentionen und langreichweitige Abhängigkeiten ohne komplizierte hand-konstruierte Merkmale oder neuronale Netzarchitekturen. Zudem adaptieren wir ein Tensordot-Produkt, um Relationenlabels simultan vorherzusagen, ohne auf historienbasierte Vorhersagen oder Suchstrategien zurückgreifen zu müssen. Diese Fortschritte vereinfachen das Modell und den Algorithmus für die Extraktion von benannten Entitäten und Relationen erheblich. Trotz seiner Einfachheit zeigen die experimentellen Ergebnisse, dass die vorgeschlagene Methode die Stand-of-the-Art-Methoden auf den CoNLL04- und ACE05-Englisch-Datensätzen übertrifft. Zudem bestätigen wir, dass die Methode auf dem ACE05-Datensatz eine vergleichbare Leistung mit den aktuellen NER-Modellen erzielt, wenn mehrere Sätze zur Kontextaggregation bereitgestellt werden.