Hierarchische Sketch-Induktion für die Paraphrasen-Generierung

Wir schlagen ein generatives Modell zur Paraphrasen-Generierung vor, das syntaktische Vielfalt fördert, indem es auf einer expliziten syntaktischen Skizze bedingt wird. Wir führen hierbei hierarchisch verfeinerte quantisierte Variationsautoencoder (HRQ-VAE) ein, eine Methode zur Lernung von Zerlegungen dichter Kodierungen als Folge diskreter latenter Variablen, die schrittweise Verfeinerungen mit zunehmender Granularität vornehmen. Diese Hierarchie von Codes wird durch end-to-end-Training erlernt und stellt fein- bis grobgranulare Informationen über die Eingabe dar. Wir nutzen HRQ-VAE, um die syntaktische Struktur eines Eingabesatzes als Pfad durch die Hierarchie zu kodieren, wodurch die Vorhersage syntaktischer Skizzen zur Testzeit deutlich vereinfacht wird. Umfangreiche Experimente, einschließlich einer menschlichen Bewertung, bestätigen, dass HRQ-VAE eine hierarchische Darstellung des Eingaberaums erlernt und Paraphrasen höherer Qualität generiert als bisherige Systeme.