Amélioration de l'extraction de relations à l'échelle du document par injection de connaissances entité

L'extraction de relations à l'échelle du document (RE) vise à identifier les relations entre les entités au sein d'un document entier. Elle nécessite des compétences de raisonnement complexes afin de synthétiser diverses formes de connaissances, telles que les anaphores et les connaissances courantes. Les grands graphes de connaissances (KG) contiennent une richesse de faits du monde réel, et peuvent fournir une connaissance précieuse pour l'extraction de relations à l'échelle du document. Dans cet article, nous proposons un cadre d'injection de connaissances sur les entités afin d'améliorer les modèles actuels d'extraction de relations à l'échelle du document. Plus précisément, nous introduisons une distillation des anaphores afin d'intégrer les connaissances sur les anaphores, dotant ainsi le modèle de RE d'une capacité plus générale de raisonnement anaphorique. Nous utilisons également une reconciliation de représentations pour injecter des connaissances factuelles et agréger les représentations du graphe de connaissances et celles du document dans un même espace. Les expériences menées sur deux jeux de données de référence valident la généralisation de notre cadre d'injection de connaissances sur les entités ainsi que l'amélioration constante apportée à plusieurs modèles d'extraction de relations à l'échelle du document.