HyperAIHyperAI
vor 11 Tagen

Faktorisierung von Bedeutung und Form für absichtserhaltende Paraphrasierung

Tom Hosking, Mirella Lapata
Faktorisierung von Bedeutung und Form für absichtserhaltende Paraphrasierung
Abstract

Wir schlagen eine Methode zur Generierung von Paraphrasen englischer Fragen vor, die die ursprüngliche Absicht bewahren, jedoch eine andere Oberflächenform aufweisen. Unser Modell kombiniert eine sorgfältig gewählte Trainingsziel-Funktion mit einem prinzipienbasierten Informationsbottleneck, um einen latenten Codierungsraum zu induzieren, der Bedeutung und Form entkoppelt. Wir trainieren ein Encoder-Decoder-Modell, um eine Frage aus einer Paraphrase mit derselben Bedeutung und einem Exemplar mit derselben Oberflächenform wiederherzustellen, wodurch sich getrennte Codierungsraumstrukturen ergeben. Wir verwenden einen vektorquantisierten variationalen Autoencoder, um die Oberflächenform als Menge diskreter latenter Variablen darzustellen, was es uns ermöglicht, im Testzeitpunkt mithilfe eines Klassifikators eine andere Oberflächenform auszuwählen. Entscheidend ist, dass unsere Methode keinen Zugriff auf eine externe Quelle von Ziel-Exemplaren erfordert. Ausführliche Experimente sowie eine menschliche Bewertung zeigen, dass wir Paraphrasen generieren können, die im Vergleich zu früheren Methoden ein besseres Gleichgewicht zwischen semantischer Erhaltung und syntaktischer Neuheit erreichen.

Faktorisierung von Bedeutung und Form für absichtserhaltende Paraphrasierung | Neueste Forschungsarbeiten | HyperAI