Command Palette
Search for a command to run...
Wissensgraphenerstellung aus Text
Wissensgraphenerstellung aus Text
Igor Melnyk Pierre Dognin Payel Das
Zusammenfassung
In dieser Arbeit schlagen wir ein neues end-to-end mehrstufiges System zur Generierung von Wissensgraphen (KG) aus textuellen Eingaben vor, das den Gesamtprozess in zwei Stufen unterteilt. Zunächst werden die Knoten des Graphen mithilfe eines vortrainierten Sprachmodells generiert, gefolgt von einem einfachen Kantenkonstruktionskopf, der eine effiziente Extraktion von Wissensgraphen aus dem Text ermöglicht. Für jede Stufe betrachten wir mehrere architektonische Optionen, die je nach den verfügbaren Trainingsressourcen verwendet werden können. Wir haben das Modell anhand des aktuellen WebNLG 2020 Challenge-Datensatzes evaluiert und dabei die Stand der Technik bei der Aufgabe der Text-zu-RDF-Generierung erreicht. Darüber hinaus haben wir es auf den Datensätzen des New York Times (NYT) und dem groß angelegten TekGen-Datensatz getestet, wobei es insgesamt starke Leistungen zeigte und die existierenden Baselines übertraf. Wir sind der Überzeugung, dass das vorgeschlagene System eine brauchbare Alternative zur Konstruktion von Wissensgraphen gegenüber den bestehenden Linearisierungs- oder sampling-basierten Ansätzen darstellt. Unser Code ist unter https://github.com/IBM/Grapher zu finden.