HyperAIHyperAI
vor 17 Tagen

HySPA: Hybrid Span Generation für skalierbare Text-zu-Graph-Extraktion

Liliang Ren, Chenkai Sun, Heng Ji, Julia Hockenmaier
HySPA: Hybrid Span Generation für skalierbare Text-zu-Graph-Extraktion
Abstract

Die Text-zu-Graph-Extraktion zielt darauf ab, Informationssysteme, bestehend aus Erwähnungen und Typen, automatisch aus natürlichen Sprachtexten zu extrahieren. Bestehende Ansätze wie Tabellenfüllung oder paarweises Scoring haben auf verschiedenen Aufgaben der Informationsextraktion beeindruckende Leistungen gezeigt, sind jedoch aufgrund ihrer zweiten Ordnung in Bezug auf Raum- und Zeitkomplexität bezüglich der Eingabekontextlänge schwer skalierbar, insbesondere bei längeren Texten. In dieser Arbeit stellen wir einen Hybrid Span Generator (HySPA) vor, der die Informationssysteme invertierbar auf eine alternierende Sequenz von Knoten und Kanten-Typen abbildet und solche Sequenzen direkt über einen hybriden Span-Decoder erzeugt, der sowohl die Spanne als auch die Typen rekursiv mit linearer Zeit- und Raumkomplexität verarbeitet. Umfangreiche Experimente auf dem ACE05-Datensatz zeigen, dass unser Ansatz auch signifikant die derzeit besten Verfahren bei der gemeinsamen Entität- und Relationsextraktion übertrifft.