Génération de texte à partir de graphes de connaissances avec des transformateurs graphiques

La génération de textes exprimant des idées complexes sur plusieurs phrases nécessite une représentation structurée de leur contenu (plan de document), mais ces représentations sont extrêmement coûteuses à produire manuellement. Dans ce travail, nous abordons le problème de la génération de textes cohérents composés de plusieurs phrases à partir de la sortie d'un système d'extraction d'information, et plus particulièrement d'un graphe de connaissances. Les représentations graphiques des connaissances sont omniprésentes en informatique, mais posent un défi considérable pour les techniques de génération de texte en raison de leur nature non hiérarchique, du chevauchement des dépendances à longue distance et de leur variété structurelle. Nous présentons un nouvel encodeur transformateur graphique capable d'exploiter la structure relationnelle de tels graphes de connaissances sans imposer des contraintes de linéarisation ou hiérarchiques. Intégré dans une configuration encodeur-décodeur, nous fournissons un système entièrement entraînable pour la génération texte-graphe que nous appliquons au domaine du texte scientifique. Les évaluations automatiques et humaines montrent que notre technique produit des textes plus informatifs qui présentent une meilleure structure documentaire que les méthodes concurrentes encodeur-décodeur.