HyperAIHyperAI
il y a 11 jours

Extraction conjointe d'entités et de relations avec des réseaux de prédiction d'ensembles

Dianbo Sui, Yubo Chen, Kang Liu, Jun Zhao, Xiangrong Zeng, Shengping Liu
Extraction conjointe d'entités et de relations avec des réseaux de prédiction d'ensembles
Résumé

La tâche d'extraction conjointe d'entités et de relations vise à extraire tous les triplets relationnels à partir d'une phrase. En essence, les triplets relationnels contenus dans une phrase forment un ensemble non ordonné. Toutefois, les modèles précédents basés sur seq2seq doivent convertir cet ensemble de triplets en une séquence pendant l'entraînement. Pour surmonter cette limitation, nous traitons l'extraction conjointe d'entités et de relations comme un problème de prédiction directe d'ensemble, permettant ainsi au modèle d'extraction de s'affranchir de la contrainte de prédire l'ordre des différents triplets. Pour résoudre ce problème de prédiction d'ensemble, nous proposons des réseaux fondés sur les transformateurs et utilisant une décodage parallèle non autoregressif. Contrairement aux approches autoregressives qui génèrent les triplets un par un selon un ordre prédéfini, les réseaux proposés produisent directement l'ensemble final des triplets en une seule étape. En outre, nous avons conçu une fonction de perte basée sur les ensembles, qui impose des prédictions uniques grâce à un appariement bipartite. Contrairement à la perte d'entropie croisée, qui pénalise fortement de petites variations dans l'ordre des triplets, la perte d'appariement bipartite proposée est invariante à toute permutation des prédictions ; elle fournit donc aux réseaux proposés un signal d'entraînement plus précis en ignorant l'ordre des triplets et en se concentrant sur les types de relations et les entités. Des expériences menées sur deux jeux de données standard montrent que notre modèle proposé surpasser significativement les méthodes de pointe actuelles. Le code d'entraînement et les modèles entraînés seront disponibles à l'adresse http://github.com/DianboWork/SPN4RE.

Extraction conjointe d'entités et de relations avec des réseaux de prédiction d'ensembles | Articles de recherche récents | HyperAI