Extraktion von Entitäten, Relationen und Ereignissen mit kontextualisierten Span-Repräsentationen

Wir untersuchen die Fähigkeiten eines einheitlichen, mehraufgabenfähigen Rahmens für drei Aufgaben der Informationsgewinnung: Named Entity Recognition (NER), Relationserkennung und Ereigniserkennung. Unser Rahmenwerk (DyGIE++) bewältigt alle Aufgaben durch die Aufzählung, Verfeinerung und Bewertung von Textsegmenten, die sowohl lokale (innerhalb von Sätzen) als auch globale (über Sätze hinweg) Kontextinformationen erfassen. Unser Ansatz erzielt state-of-the-art Ergebnisse auf allen drei Aufgaben und auf vier Datensätzen aus unterschiedlichen Domänen. Wir führen Experimente durch, um verschiedene Techniken zum Aufbau von Segmentrepräsentationen miteinander zu vergleichen. Kontextualisierte Embeddings wie BERT erweisen sich als besonders effektiv bei der Erfassung von Beziehungen zwischen Entitäten in denselben oder benachbarten Sätzen, während dynamische Aktualisierungen von Segment-Graphen langreichweitige, über Sätze hinweg reichende Beziehungen modellieren können. Beispielsweise ermöglicht die Propagierung von Segmentrepräsentationen über vorhergesagte Coreferenz-Verbindungen dem Modell, schwierige Entitätsreferenzen zu entwirren. Unser Quellcode ist öffentlich unter https://github.com/dwadden/dygiepp verfügbar und kann problemlos für neue Aufgaben oder Datensätze angepasst werden.