HyperAIHyperAI
il y a 2 mois

EventNarrative : Un grand ensemble de données centré sur les événements pour la génération de texte à partir de graphes de connaissances

Anthony Colas; Ali Sadeghian; Yue Wang; Daisy Zhe Wang
EventNarrative : Un grand ensemble de données centré sur les événements pour la génération de texte à partir de graphes de connaissances
Résumé

Nous présentons EventNarrative, un ensemble de données de génération de texte à partir de graphes de connaissances (knowledge graphs) issus de sources ouvertes et accessibles au public. Compte tenu des récentes avancées dans l'extraction d'information événementielle (Information Extraction, IE), et du fait que les recherches antérieures sur la génération de texte à partir de graphes se sont concentrées sur des graphes de connaissances centrés sur les entités, cet article met l'accent sur des données centrées sur les événements. Cependant, notre système de génération de données peut toujours être adapté à d'autres types de données issues des graphes de connaissances.Les ensembles de données existants à grande échelle dans le domaine de la génération de texte à partir de graphes ne sont pas parallèles, ce qui signifie qu'il existe une importante discordance entre les graphes de connaissances et le texte. Les ensembles de données qui possèdent des paires associant un graphe et un texte sont limités en taille et ont été générés manuellement ou sans une ontologie riche, rendant les graphes correspondants peu denses. De plus, ces ensembles contiennent nombre d'entités non liées entre leurs paires graphe-texte.EventNarrative comprend environ 230 000 graphes et leur texte naturel correspondant, soit six fois plus que le plus grand ensemble parallèle actuellement disponible. Il utilise une ontologie riche, toutes les entités des graphes de connaissances étant liées au texte, et nos annotations manuelles confirment une haute qualité des données. Notre objectif est double : aider à ouvrir la voie à la recherche centrée sur les événements où il manque des données, et fournir aux chercheurs un ensemble bien défini et à grande échelle pour évaluer plus efficacement les modèles existants et futurs de génération de texte à partir de graphes.Nous évaluons également deux types d'algorithmes baselines sur EventNarrative : un modèle spécifique à la génération de texte à partir de graphes et deux modèles linguistiques d'avant-garde (state-of-the-art), dont des travaux précédents ont montré qu'ils peuvent être adaptés au domaine de la génération de texte à partir des graphes de connaissances.

EventNarrative : Un grand ensemble de données centré sur les événements pour la génération de texte à partir de graphes de connaissances | Articles de recherche récents | HyperAI