Amélioration de l'extraction de relations à l'échelle du document grâce à la contextualisation des représentations des mentions et au pondération des paires de mentions
L'extraction de relations à l'échelle du document (document-level relation extraction, RE) a suscité un intérêt considérable, car un grand nombre de faits relationnels sont exprimés à travers plusieurs phrases. Récemment, les modèles basés sur l'architecture encodeur-aggrégateur se sont avérés prometteurs pour l'extraction de relations à l'échelle du document. Toutefois, ces modèles présentent deux limites majeures : (i) ils ne parviennent pas à obtenir des représentations contextualisées pour une mention à faible coût computationnel lorsque cette dernière participe à plusieurs paires d'entités ; (ii) ils négligent les poids différents attribués aux paires de mentions associées à une paire d'entités cible. Pour résoudre ces deux problèmes, nous proposons dans cet article un nouveau modèle encodeur-attendeur-aggrégateur, qui introduit deux mécanismes d'attention entre l'encodeur et l'aggrégateur. Plus précisément, un attendeur mutuel est d'abord appliqué aux mentions tête et queue sélectionnées afin de produire efficacement des représentations contextualisées des mentions. Ensuite, un attendeur d'intégration est utilisé pour pondérer les paires de mentions associées à une paire d'entités cible. Des expériences étendues sur deux jeux de données d'extraction de relations à l'échelle du document montrent que le modèle proposé dépasse les meilleures méthodes actuelles. Nos codes sont disponibles publiquement à l'adresse suivante : "https://github.com/nefujiangping/EncAttAgg".