ENT-DESC: Entitätsbeschreibungserstellung durch Exploration von Wissensgraphen

Frühere Arbeiten zur Generierung von Wissen zu Text verwenden als Eingabe einige RDF-Tripel oder Schlüssel-Wert-Paare, die das Wissen über bestimmte Entitäten vermitteln, um eine natürlichsprachliche Beschreibung zu erzeugen. Bestehende Datensätze wie WIKIBIO, WebNLG und E2E weisen im Wesentlichen eine gute Übereinstimmung zwischen einem Eingabe-Tripel-/Paar-Satz und dem Ausgabe-Text auf. In der Praxis kann jedoch die Eingabewissensmenge viel größer sein, da die Ausgabebeschreibung möglicherweise nur das wichtigste Wissen abdeckt. In dieser Arbeit stellen wir einen groß angelegten und anspruchsvollen Datensatz vor, der die Untersuchung solcher praktischer Szenarien in der KG-zu-Text-Generierung erleichtern soll. Unser Datensatz beinhaltet das Abrufen reichhaltigen Wissens verschiedener Hauptentitätstypen aus einem großen Wissensgraphen (KG), was dazu führt, dass aktuelle Graph-zu-Sequenz-Modelle bei der Generierung von Beschreibungen schwer mit den Problemen von Informationsverlust und Parameterexplosion kämpfen. Wir begegnen diesen Herausforderungen durch den Vorschlag einer Multi-Graph-Struktur, die in der Lage ist, die ursprüngliche Graphinformationsstruktur umfassender darzustellen. Darüber hinaus integrieren wir Aggregationsmethoden, die lernen, die reichhaltige Graphinformation zu extrahieren. Umfangreiche Experimente zeigen die Effektivität unserer Modellarchitektur.