Command Palette
Search for a command to run...
ENT-DESC : Génération de Descriptions d'Entités en Explorant le Graphe de Connaissances
ENT-DESC : Génération de Descriptions d'Entités en Explorant le Graphe de Connaissances
Liying Cheng Dekun Wu Lidong Bing Yan Zhang Zhanming Jie Wei Lu Luo Si
Résumé
Les travaux précédents sur la génération de texte à partir de connaissances prennent en entrée quelques triples RDF ou paires clé-valeur transmettant les connaissances de certaines entités pour générer une description en langage naturel. Les jeux de données existants, tels que WIKIBIO, WebNLG et E2E, présentent globalement une bonne correspondance entre un ensemble de triples/paires d'entrée et son texte de sortie. Cependant, en pratique, les connaissances d'entrée peuvent être bien plus abondantes, car la description de sortie peut ne couvrir que les connaissances les plus significatives. Dans cet article, nous introduisons un jeu de données à grande échelle et complexe pour faciliter l'étude d'un tel scénario pratique dans la génération de texte à partir de graphes de connaissances (KG). Notre jeu de données implique la récupération d'une abondance de connaissances variées concernant différents types d'entités principales à partir d'un grand graphe de connaissances, ce qui rend les modèles actuels de transformation graphe-séquence particulièrement vulnérables aux problèmes de perte d'information et d'explosion des paramètres lorsqu'ils génèrent des descriptions. Nous relevons ces défis en proposant une structure multi-graphe capable de représenter l'information du graphe original de manière plus complète. De plus, nous intégrons également des méthodes d'agrégation qui apprennent à extraire l'information riche du graphe. Des expériences approfondies démontrent l'efficacité de notre architecture modèle.