HyperAIHyperAI
il y a 2 mois

Édition de texte basée sur des faits

Hayate Iso; Chao Qiao; Hang Li
Édition de texte basée sur des faits
Résumé

Nous proposons une nouvelle tâche d'édition de texte, appelée \textit{édition de texte basée sur des faits}, dont l'objectif est de réviser un document donné pour mieux décrire les faits contenus dans une base de connaissances (par exemple, plusieurs triplets). Cette tâche est importante en pratique car refléter la vérité est une exigence courante lors de l'édition de texte. Tout d'abord, nous présentons une méthode pour générer automatiquement un jeu de données destiné à la recherche en édition de texte basée sur des faits, où chaque instance comprend un texte brouillon, un texte révisé et plusieurs faits représentés par des triplets. Nous appliquons cette méthode à deux jeux de données publics transformant des tableaux en texte, obtenant ainsi deux nouveaux jeux de données composés respectivement de 233 000 et 37 000 instances. Ensuite, nous proposons une nouvelle architecture de réseau neuronal pour l'édition de texte basée sur des faits, nommée \textsc{FactEditor}, qui modifie un texte brouillon en se référant aux faits donnés à travers un tampon, un flux et une mémoire. Une approche directe pour résoudre ce problème consisterait à utiliser un modèle encodeur-décodeur. Nos résultats expérimentaux sur les deux jeux de données montrent que \textsc{FactEditor} surpasse l'approche encodeur-décodeur en termes de fidélité et de fluidité. Les résultats indiquent également que \textsc{FactEditor} effectue l'inférence plus rapidement que l'approche encodeur-décodeur.

Édition de texte basée sur des faits | Articles de recherche récents | HyperAI