Réseau d'interaction récurrent pour l'extraction conjointe d'entités et la classification des relations

L'idée d'utiliser des approches d'apprentissage multi-tâches pour traiter l'extraction conjointe des entités et des relations est motivée par la corrélation entre la tâche de reconnaissance d'entités et celle de classification de relations. Les méthodes existantes basées sur l'apprentissage multi-tâches abordent ce problème en apprenant les interactions entre les deux tâches à travers un réseau partagé, où les informations partagées sont transmises aux réseaux spécifiques à chaque tâche pour la prédiction. Toutefois, une telle approche limite la capacité du modèle à apprendre des interactions explicites entre les deux tâches, ce qui nuit à l'amélioration des performances sur chacune d'elles. À cette fin, nous proposons un modèle d'apprentissage multi-tâches que nous appelons réseau d'interaction récurrente, permettant d'apprendre dynamiquement les interactions afin de modéliser efficacement les caractéristiques spécifiques à chaque tâche pour la classification. Des études empiriques menées sur deux jeux de données réels confirment l'avantage du modèle proposé.