HyperAIHyperAI
vor 2 Monaten

Schritt für Schritt: Trennung von Planung und Realisierung bei der neuronalen Daten-zu-Text-Generierung

Amit Moryossef; Yoav Goldberg; Ido Dagan
Schritt für Schritt: Trennung von Planung und Realisierung bei der neuronalen Daten-zu-Text-Generierung
Abstract

Die Daten-zu-Text-Generierung kann konzeptionell in zwei Teile unterteilt werden: die Anordnung und Strukturierung der Informationen (Planung) sowie die Erzeugung fließender Sprache, die diese Informationen beschreibt (Realisierung). Moderne neuronale Generierungssysteme vereinen diese beiden Schritte zu einem einzigen, von Anfang bis Ende differenzierbaren System. Wir schlagen vor, den Generierungsprozess in eine symbolische Textplanungsphase aufzuteilen, die dem Eingangstreue gegenübersteht, gefolgt von einer neuronalen Generierungsphase, die sich ausschließlich auf die Realisierung konzentriert. Für das Training eines Plan-zu-Text-Generators stellen wir eine Methode zur Verfügung, mit der Referenztexte ihren entsprechenden Textplänen zugeordnet werden können. Für die Inferenzzeit beschreiben wir eine Methode zur Auswahl hochwertiger Textpläne für neue Eingaben. Wir implementieren und evaluieren unseren Ansatz am WebNLG-Benchmark. Unsere Ergebnisse zeigen, dass das Trennen der Textplanung von der neuronalen Realisierung tatsächlich die Zuverlässigkeit und Angemessenheit des Systems verbessert, während es flüssige Ausgaben beibehält. Wir beobachten Verbesserungen sowohl in den BLEU-Werten als auch in manuellen Bewertungen. Ein weiterer Vorteil unseres Ansatzes ist die Fähigkeit, verschiedene Realisierungen derselben Eingabe zu erzeugen, was den Weg zu expliziter Kontrolle über die Struktur des generierten Textes ebnen.In dieser Übersetzung wurden folgende Entscheidungen getroffen:- "Data-to-text generation" wurde als "Daten-zu-Text-Generierung" übersetzt.- "Plan-to-text generator" wurde als "Plan-zu-Text-Generator" übersetzt.- "WebNLG benchmark" wurde als "WebNLG-Benchmark" übersetzt.- Die technischen Begriffe wie "BLEU scores", "inference time" und "neural realization" wurden direkt ins Deutsche übersetzt, um den formellen Ton und die Klarheit zu wahren.- Die Struktur des Satzes wurde angepasst, um dem deutschen Lesefluss gerecht zu werden und gleichzeitig dem Originaltext treu zu bleiben.

Schritt für Schritt: Trennung von Planung und Realisierung bei der neuronalen Daten-zu-Text-Generierung | Neueste Forschungsarbeiten | HyperAI