HyperAIHyperAI
vor 2 Monaten

Neuronale Daten-zu-Text-Generierung: Ein Vergleich zwischen Pipeline- und End-to-End-Architekturen

Thiago Castro Ferreira; Chris van der Lee; Emiel van Miltenburg; Emiel Krahmer
Neuronale Daten-zu-Text-Generierung: Ein Vergleich zwischen Pipeline- und End-to-End-Architekturen
Abstract

Traditionell wurden die meisten Anwendungen zur Daten-zu-Text-Umsetzung unter Verwendung einer modularen Pipeline-Architektur entwickelt, bei der nicht-sprachliche Eingabedaten durch mehrere Zwischentransformationen in natürliche Sprache umgewandelt werden. Im Gegensatz dazu wurden kürzlich neurale Modelle für die Daten-zu-Text-Erzeugung als End-to-End-Ansätze vorgeschlagen, bei denen die nicht-sprachliche Eingabe mit viel weniger expliziten Zwischendarstellungen direkt in natürliche Sprache übertragen wird. Diese Studie führt eine systematische Vergleichsanalyse zwischen neuronalen Pipeline- und End-to-End-Ansätzen zur Texterzeugung aus RDF-Tripeln durch. Beide Architekturen wurden unter Verwendung modernster Methoden des tiefen Lernens implementiert, darunter Encoder-Decoder-Gated-Recurrent Units (GRU) und Transformer. Automatische und menschliche Bewertungen sowie eine qualitative Analyse deuten darauf hin, dass explizite Zwischenschritte im Generierungsprozess zu besseren Texten führen als die von End-to-End-Ansätzen erzeugten Texte. Darüber hinaus verallgemeinern die Pipeline-Modelle besser auf unbekannte Eingaben. Die verwendeten Daten und Code sind öffentlich zugänglich.

Neuronale Daten-zu-Text-Generierung: Ein Vergleich zwischen Pipeline- und End-to-End-Architekturen | Neueste Forschungsarbeiten | HyperAI