Textgenerierung durch adversariales Training unter Verwendung von Skip-Thought-Vektoren

GANs (Generative Adversarial Networks) haben sich bei Aufgaben im Bereich der Bildgenerierung und Stilvermittlung als außerordentlich effektiv erwiesen. Im Bereich des Sprachmodellierens sind Wort-Einbettungen wie GLoVe und word2vec die neuesten Methoden zur Anwendung von neuronalen Netzwerken auf textuelle Daten. Versuche wurden unternommen, GANs mit Wort-Einbettungen für die Textgenerierung zu nutzen. Diese Studie präsentiert einen Ansatz zur Textgenerierung unter Verwendung von Skip-Thought-Satz-Einbettungen mit GANs, die auf Gradientenstrafefunktionen und F-Maßen basieren. Die vorgeschlagene Architektur zielt darauf ab, den Schreibstil im generierten Text durch Modellierung der Ausdrucksweise auf Satzebene in sämtlichen Werken eines Autors wiederzugeben. Umfangreiche Experimente wurden in verschiedenen Einbettungskonfigurationen bei einer Vielzahl von Aufgaben durchgeführt, darunter bedingte Textgenerierung und Sprachgenerierung. Das Modell übertrifft Baseline-Textgenerierungsnetzwerke bei mehreren automatischen Evaluationsmetriken wie BLEU-n, METEOR und ROUGE. Darüber hinaus wird die breite Anwendbarkeit und Effektivität in realen Aufgaben durch Bewertungen menschlicher Beurteiler nachgewiesen.