HyperAIHyperAI
il y a 13 jours

Le bruit sémantique compte pour la génération neurale de langage naturel

Ondřej Dušek, David M. Howcroft, Verena Rieser
Le bruit sémantique compte pour la génération neurale de langage naturel
Résumé

Les systèmes de génération de langage naturel neuronal (NNLG) sont connus pour produire des sorties pathologiques, c’est-à-dire des textes qui sont déconnectés de la spécification d’entrée. Dans cet article, nous étudions l’impact du bruit sémantique sur les modèles NNLG de pointe mettant en œuvre différentes mécaniques de contrôle sémantique. Nous constatons que l’utilisation de données nettoyées peut améliorer la correction sémantique jusqu’à 97 %, tout en préservant la fluidité du texte généré. Nous observons également que l’erreur la plus fréquente consiste à omettre des informations, plutôt qu’à générer des hallucinations.