Einheitliche Strukturgenerierung für die universelle Informationsextraktion

Die Informationsextraktion leidet unter variablen Zielen, heterogenen Strukturen und anwendungsspezifischen Schemata. In dieser Arbeit schlagen wir ein einheitliches Text-zu-Struktur-Generierungsframework vor, das als UIE bezeichnet wird. Dieses Framework kann verschiedene IE-Aufgaben (Information Extraction) allgemein modellieren, zielgerichtete Strukturen adaptiv generieren und allgemeine IE-Fähigkeiten aus verschiedenen Wissensquellen kooperativ lernen. Insbesondere kodiert UIE verschiedene Extraktionsstrukturen einheitlich durch eine strukturierte Extraktionsprache, generiert zielgerichtete Extraktionen adaptiv durch ein schemabasiertes Prompt-Mechanismus – den strukturellen Schema-Instruktor – und erfasst die gemeinsamen IE-Fähigkeiten durch ein groß angelegtes vortrainiertes Text-zu-Struktur-Modell. Experimente zeigen, dass UIE den Stand der Technik in 4 IE-Aufgaben, 13 Datensätzen und in allen überwachten, ressourcenarmen und few-shot-Einstellungen für eine breite Palette von Entitäts-, Relationen-, Ereignis- und Sentimentextraktionsaufgaben sowie deren Vereinigung erreicht hat. Diese Ergebnisse bestätigen die Effektivität, Universalität und Übertragbarkeit von UIE.