RESIDE : Amélioration de l'extraction relationnelle neuronale supervisée à distance grâce aux informations latérales

Les méthodes d'extraction de relations supervisées à distance (RE) forment un extracteur en alignant automatiquement des instances de relations dans une base de connaissances (KB) avec du texte non structuré. En plus des instances de relations, les bases de connaissances contiennent souvent d'autres informations pertinentes, telles que des alias de relations (par exemple, "fondé" et "co-fondé" sont des alias pour la relation "fondateurDeSociété"). Les modèles RE ignorent généralement ces informations annexes facilement disponibles. Dans cet article, nous proposons RESIDE, une méthode d'extraction de relations neuronales supervisée à distance qui utilise des informations annexes supplémentaires provenant des bases de connaissances pour améliorer l'extraction de relations. Elle utilise les types d'entités et les alias de relations pour imposer des contraintes souples lors de la prédiction des relations. RESIDE emploie des réseaux de convolution graphique (GCN) pour encoder les informations syntaxiques issues du texte et améliore les performances même lorsque peu d'informations annexes sont disponibles. À travers des expériences approfondies sur des jeux de données de référence, nous démontrons l'efficacité de RESIDE. Nous avons rendu le code source de RESIDE disponible afin d'encourager la recherche reproductible.