Un réseau d'attention spécifique à la relation pour une extraction conjointe d'entités et de relations

L'extraction conjointe des entités et des relations est une tâche importante en traitement du langage naturel (NLP), dont l'objectif est de capturer tous les triplets relationnels à partir de textes bruts. Ce défi est particulièrement élevé, car certains triplets extraits à partir d'une même phrase peuvent partager des entités. La plupart des méthodes existantes procèdent en deux étapes : reconnaissance d'entités, suivie de détection de relations entre toutes les paires d'entités possibles, ce qui entraîne généralement un grand nombre d'opérations redondantes. Dans cet article, nous proposons un réseau d'attention spécifique aux relations (RSAN) pour relever ce défi. Notre RSAN utilise un mécanisme d'attention sensible aux relations afin de construire des représentations spécifiques de la phrase pour chaque relation, puis effectue une étiquetage de séquence pour extraire les entités tête et queue correspondantes. Des expériences menées sur deux jeux de données publics montrent que notre modèle permet efficacement d’extraire des triplets chevauchants et atteint des performances de pointe. Le code est disponible à l’adresse suivante : https://github.com/Anery/RSAN