HyperAIHyperAI
il y a 2 mois

Transfert de Style de Formalité Semi-Supervisé avec Entraînement par Cohérence

Ao Liu; An Wang; Naoaki Okazaki
Transfert de Style de Formalité Semi-Supervisé avec Entraînement par Cohérence
Résumé

Le transfert de style formel (FST) est une tâche qui consiste à reformuler une phrase informelle en une phrase formelle sans modifier sa signification. Pour remédier au problème de pénurie de données des jeux de données parallèles existants, les études précédentes ont tendance à adopter un schéma de reconstruction cyclique afin d'utiliser des données supplémentaires non étiquetées, où le modèle FST bénéficie principalement des phrases non étiquetées du côté cible. Dans cette recherche, nous proposons un cadre semi-supervisé simple mais efficace pour mieux exploiter les phrases non étiquetées du côté source grâce à l'entraînement par cohérence. Plus précisément, notre approche enrichit les données pseudo-parallèles obtenues à partir d'une phrase informelle du côté source en contraignant le modèle à générer des sorties similaires pour ses versions perturbées. De plus, nous avons examiné empiriquement les effets de diverses méthodes de perturbation des données et proposé des stratégies de filtrage de données efficaces pour améliorer notre cadre. Les résultats expérimentaux sur la référence GYAFC démontrent que notre approche peut atteindre des performances de pointe, même avec moins de 40 % des données parallèles.