Modélisation des interactions croisées denses pour l'extraction conjointe d'entités et de relations

L'extraction conjointe des entités et de leurs relations bénéficie fortement de l'interaction étroite entre les entités nommées et les informations de relation. Par conséquent, la modélisation efficace de ces interactions intermodales est cruciale pour la performance finale. Les travaux antérieurs ont recouru à des méthodes simples telles que la concaténation de caractéristiques d'étiquettes afin de réaliser une fusion sémantique grossière entre instances intermodales, mais ces approches échouent à capturer des corrélations fines au niveau des tokens et des étiquettes, entraînant ainsi des interactions insuffisantes. Dans cet article, nous proposons un réseau d'attention intermodale profond (CMAN) pour l'extraction conjointe d'entités et de relations. Ce réseau est soigneusement construit en empilant plusieurs unités d'attention en profondeur, permettant ainsi de modéliser pleinement les interactions denses dans l'espace token-étiquette, où deux unités d'attention fondamentales sont introduites pour capturer explicitement des corrélations fines entre différentes modalités (par exemple, token à token et étiquette à token). Les résultats expérimentaux sur le jeu de données CoNLL04 montrent que notre modèle atteint des performances de pointe, avec un score F1 de 90,62 % pour la reconnaissance d'entités et de 72,97 % pour la classification de relations. Sur le jeu de données ADE, notre modèle dépasse les approches existantes de plus de 1,9 % en F1 pour la classification de relations. Des analyses étendues confirment en outre l'efficacité de notre approche.