OpenUE: Ein offenes Werkzeugset für universelle Extraktion aus Text

Natürliche Sprachverarbeitung umfasst eine Vielzahl von Aufgaben mit Verständnis auf Token- oder Satzebene. In diesem Paper präsentieren wir einen einfachen, aber tiefgreifenden Ansatz, dass die meisten dieser Aufgaben in einer einzigen universellen Extraktionsform darstellbar sind. Wir stellen ein Prototypmodell vor und stellen ein quelloffenes, erweiterbares Werkzeugkit namens OpenUE für verschiedene Extraktionsaufgaben bereit. OpenUE ermöglicht Entwicklern, benutzerdefinierte Modelle zur Informationsextraktion aus Text zu trainieren, und unterstützt Forscher bei der schnellen Validierung von Modellen. Zudem bietet OpenUE verschiedene funktionale Module, um eine hohe Modularität und Erweiterbarkeit zu gewährleisten. Neben dem Werkzeugkit bereitstellen wir zudem eine Online-Demo mit RESTful-APIs, die eine Echtzeit-Extraktion ohne eigenständiges Training und Bereitstellen von Modellen ermöglicht. Darüber hinaus kann das Online-System Informationen in verschiedenen Aufgabenbereichen extrahieren, darunter relationale Tripel-Extraktion, Slot- und Intent-Erkennung, Ereignisextraktion usw. Wir veröffentlichen den Quellcode, Datensätze und vortrainierte Modelle, um zukünftige Forschungen zu fördern, unter http://github.com/zjunlp/openue.