HyperAIHyperAI
il y a 2 mois

CopyMTL : Mécanisme de copie pour l'extraction conjointe d'entités et de relations avec l'apprentissage multi-tâches

Daojian Zeng; Ranran Haoran Zhang; Qianying Liu
CopyMTL : Mécanisme de copie pour l'extraction conjointe d'entités et de relations avec l'apprentissage multi-tâches
Résumé

L'extraction conjointe d'entités et de relations a suscité une attention considérable en raison de son potentiel à améliorer les performances des deux tâches. Parmi les méthodes existantes, CopyRE se distingue par son efficacité et sa nouveauté, utilisant un cadre séquence-à-séquence et un mécanisme de copie pour générer directement les triplets de relations. Cependant, cette méthode souffre de deux problèmes majeurs. Le modèle est extrêmement faible pour différencier l'entité tête de l'entité queue, ce qui entraîne une extraction d'entités imprecise. Il ne peut également pas prédire des entités composées de plusieurs tokens (par exemple, \textit{Steven Jobs}). Pour résoudre ces problèmes, nous avons mené une analyse détaillée des raisons sous-jacentes à l'extraction imprecise des entités, puis proposé une structure de modèle simple mais extrêmement efficace pour y remédier. De plus, nous avons développé un cadre d'apprentissage multitâche équipé d'un mécanisme de copie, appelé CopyMTL, permettant au modèle de prédire des entités composées de plusieurs tokens. Les expériences mettent en évidence les problèmes de CopyRE et montrent que notre modèle réalise une amélioration significative par rapport à la méthode actuelle la plus avancée, avec une augmentation de 9 % sur le jeu de données NYT et de 16 % sur WebNLG (score F1). Notre code est disponible sur https://github.com/WindChimeRan/CopyMTL.