Möge die Macht mit Ihrem Kopiermechanismus sein: Verbesserter überwachter Kopieransatz für die Generierung natürlicher Sprache

Neuere neuronale sequenz-zu-Sequenz-Modelle mit einer Kopiermechanik haben erhebliche Fortschritte bei verschiedenen Textgenerierungsaufgaben erzielt. Diese Modelle haben Probleme mit Wörtern außerhalb des Vokabulars adressiert und die Generierung seltener Wörter erleichtert. Allerdings ist die Identifizierung des Wortes, das kopiert werden muss, schwierig, wie bereits bei vorherigen Kopiermodellen beobachtet wurde, die unter falscher Generierung und mangelnder Abstraktion leiden. In diesem Paper stellen wir einen neuartigen überwachten Ansatz für ein Kopiernetzwerk vor, der dem Modell hilft, zu entscheiden, welche Wörter kopiert und welche generiert werden müssen. Konkret definieren wir die Ziel-Funktion neu, die Quellsequenzen und Zielvokabulare als Leitfaden für das Kopieren nutzt. Die experimentellen Ergebnisse auf Aufgaben der Datensatz-zu-Text-Generierung und abstraktiven Zusammenfassung bestätigen, dass unser Ansatz die Qualität des Kopierens verbessert und das Maß an Abstraktion erhöht.