Un système non supervisé conjoint pour la génération de texte à partir de graphes de connaissances et l'analyse sémantique

Les graphes de connaissances (KGs) peuvent varier considérablement d'un domaine à l'autre. Par conséquent, les approches supervisées pour la génération de texte à partir de graphes et l'extraction de connaissances à partir du texte vers le graphe (analyse sémantique) souffriront toujours d'un manque de données parallèles spécifiques au domaine ; en même temps, adapter un modèle formé sur un domaine différent est souvent impossible en raison d'une faible ou nulle superposition des entités et des relations. Cette situation nécessite une approche qui (1) n'a pas besoin de grandes quantités de données annotées et donc (2) n'a pas besoin de s'appuyer sur des techniques d'adaptation de domaine pour fonctionner efficacement dans différents domaines. À cette fin, nous présentons la première approche de génération de texte non supervisée à partir des graphes de connaissances et montrons simultanément comment elle peut être utilisée pour l'analyse sémantique non supervisée. Nous évaluons notre approche sur WebNLG v2.1 et un nouveau banc d'essai exploitant les graphes scéniques du Visual Genome. Notre système surpassent les méthodes de référence robustes pour les tâches de conversion texte$\leftrightarrow$graphe sans aucune adaptation manuelle d'un jeu de données à l'autre. Dans des expériences supplémentaires, nous examinons l'impact de l'utilisation d'objectifs non supervisés différents.Note: - "WebNLG" and "Visual Genome" are proper names and thus remain unchanged.- The symbol $\leftrightarrow$ is kept as is because it is commonly used in scientific literature to denote bidirectional processes or conversions.- The term "scene graphs" has been translated to "graphes scéniques," which is a common translation in the field of computer vision and natural language processing.