HyperAIHyperAI
vor 11 Tagen

Haben Sie Ihren Text und nutzen Sie ihn auch! End-to-End neuronale Daten-zu-Text-Generierung mit semantischer Treue

Hamza Harkous, Isabel Groves, Amir Saffari
Haben Sie Ihren Text und nutzen Sie ihn auch! End-to-End neuronale Daten-zu-Text-Generierung mit semantischer Treue
Abstract

End-to-end neuronale Daten-zu-Text-(D2T)-Generierung ist kürzlich als Alternative zu pipelinebasierten Architekturen hervorgetreten. Sie steht jedoch vor Herausforderungen hinsichtlich der Generalisierung auf neue Domänen und der Erzeugung semantisch konsistenter Texte. In dieser Arbeit präsentieren wir DataTuner, ein neuronales, end-to-end-System zur Daten-zu-Text-Generierung, das nur minimale Annahmen über die Datenrepräsentation und die Ziel-Domäne macht. Wir verfolgen einen zweistufigen Ansatz aus Generierung und Nachrangordnung, der ein feinabgestimmtes Sprachmodell mit einem Klassifikator für semantische Treue kombiniert. Jeder Komponente wird end-to-end gelernt, ohne dass datenspezifische Heuristiken, Entitätendelexikalisation oder Nachbearbeitung erforderlich sind. Wir zeigen, dass DataTuner state-of-the-art-Ergebnisse in automatisierten Metriken auf vier zentralen D2T-Datensätzen (LDC2017T10, WebNLG, ViGGO und Cleaned E2E) erzielt, wobei die Flüssigkeit der generierten Texte durch menschliche Beurteiler nahe oder sogar über den menschlich verfassten Referenztexten liegt. Zudem belegen wir, dass der modellbasierte Semantik-Treue-Score in DataTuner ein überlegenere Bewertungsinstrument darstellt im Vergleich zu herkömmlichen, heuristikbasierten Maßen. Die von uns generierten Texte weisen auf allen vier Datensätzen eine signifikant höhere semantische Treue im Vergleich zum Stand der Technik auf.

Haben Sie Ihren Text und nutzen Sie ihn auch! End-to-End neuronale Daten-zu-Text-Generierung mit semantischer Treue | Neueste Forschungsarbeiten | HyperAI