Dokumentenlevel-geschlossene Informationsextraktion
Die Dokumenten-basierte geschlossene Informationsextraktion (DocIE) ist die Aufgabe, Fakttripel zu extrahieren, die konsistent mit vordefinierten Wissensbasis-Entitäten und -Beziehungen sind, aus unstrukturiertem Text. DocIE umfasst UnterAufgaben wie die Erkennung von Mentions, die Erkennung von Entitätstypen, die Named Entity Recognition (NER), die Entitätsklärung, die Entitätsverlinkung und die Coreference Resolution, wobei das Ziel darin besteht, langdistanzige Abhängigkeiten zu erfassen und Beziehungen zwischen Entitäten zu extrahieren, die weit auseinanderliegen im Dokument. Diese Aufgabe hat großen Wert für Anwendungen wie den Aufbau von Wissensgraphen, Fragebeantwortungssysteme, Wissensentdeckung und Textzusammenfassung.