HyperAIHyperAI
il y a 2 mois

WikiGraphs : Un jeu de données couplant des textes Wikipédia et des graphes de connaissances

Luyu Wang; Yujia Li; Ozlem Aslan; Oriol Vinyals
WikiGraphs : Un jeu de données couplant des textes Wikipédia et des graphes de connaissances
Résumé

Nous présentons un nouveau jeu de données composé d'articles de Wikipédia associés chacun à un graphe de connaissances, afin de faciliter la recherche en génération conditionnelle de texte, génération de graphes et apprentissage de représentations de graphes. Les jeux de données existants couplant des graphes et du texte contiennent généralement des graphes petits et des textes courts (1 ou quelques phrases), ce qui limite les capacités des modèles qui peuvent être appris à partir de ces données. Notre nouveau jeu de données, WikiGraphs, est collecté en associant chaque article de Wikipédia du benchmark établi WikiText-103 (Merity et al., 2016) à un sous-graphe du graphe de connaissances Freebase (Bollacker et al., 2008). Cela permet une comparaison facile avec d'autres modèles génératifs textuels d'avant-garde capables de produire des paragraphes longs et cohérents. Les graphes et les données textuelles sont d'une ampleur significativement plus grande que celle des jeux de données précédents couplant des graphes et du texte. Nous présentons les résultats baselines d'un réseau neuronal sur graphe et d'un modèle transformer sur notre jeu de données pour trois tâches : génération graphe -> texte, recherche graphe -> texte et recherche texte -> graphe. Nous montrons que l'amélioration du conditionnement sur le graphe apporte des gains en termes de qualité de génération et de recherche, mais qu'il reste encore beaucoup d'espace pour des améliorations.Note: The term "baseline" is commonly used in French academic and technical writing to refer to initial or reference results, so it has been left untranslated.

WikiGraphs : Un jeu de données couplant des textes Wikipédia et des graphes de connaissances | Articles de recherche récents | HyperAI