HyperAIHyperAI
il y a 2 mois

Génération de texte à partir de tableaux par apprentissage sequenciel structuré

Tianyu Liu; Kexiang Wang; Lei Sha; Baobao Chang; Zhifang Sui
Génération de texte à partir de tableaux par apprentissage sequenciel structuré
Résumé

La génération de texte à partir de tableaux vise à produire une description d'un tableau factuel qui peut être considéré comme un ensemble de paires champ-valeur. Pour encoder à la fois le contenu et la structure d'un tableau, nous proposons une nouvelle architecture seq2seq sensible à la structure, composée d'un encodeur avec porte de champ et d'un générateur de description avec attention double. Dans la phase d'encodage, nous mettons à jour la mémoire des cellules de l'unité LSTM par une porte de champ et sa valeur correspondante afin d'intégrer les informations sur les champs dans la représentation du tableau. Dans la phase de décodage, un mécanisme d'attention double est proposé, comprenant une attention au niveau des mots et une attention au niveau des champs, pour modéliser la pertinence sémantique entre la description générée et le tableau. Nous menons des expériences sur le jeu de données \texttt{WIKIBIO}, qui contient plus de 700 000 biographies et leurs infoboxes correspondantes provenant de Wikipédia. Les visualisations de l'attention et les études de cas montrent que notre modèle est capable de générer des descriptions cohérentes et informatives basées sur une compréhension exhaustive du contenu et de la structure du tableau. Les évaluations automatiques montrent également que notre modèle surpassent les méthodes de base avec une marge importante. Le code pour ce travail est disponible sur https://github.com/tyliupku/wiki2bio.

Génération de texte à partir de tableaux par apprentissage sequenciel structuré | Articles de recherche récents | HyperAI