HyperAIHyperAI

Command Palette

Search for a command to run...

CopyMTL : Mécanisme de copie pour l'extraction conjointe d'entités et de relations avec l'apprentissage multi-tâches

Daojian Zeng* Ranran Haoran Zhang* Qianying Liu

Résumé

L'extraction conjointe d'entités et de relations a suscité une attention considérable en raison de son potentiel à améliorer les performances des deux tâches. Parmi les méthodes existantes, CopyRE se distingue par son efficacité et sa nouveauté, utilisant un cadre séquence-à-séquence et un mécanisme de copie pour générer directement les triplets de relations. Cependant, cette méthode souffre de deux problèmes majeurs. Le modèle est extrêmement faible pour différencier l'entité tête de l'entité queue, ce qui entraîne une extraction d'entités imprecise. Il ne peut également pas prédire des entités composées de plusieurs tokens (par exemple, \textit{Steven Jobs}). Pour résoudre ces problèmes, nous avons mené une analyse détaillée des raisons sous-jacentes à l'extraction imprecise des entités, puis proposé une structure de modèle simple mais extrêmement efficace pour y remédier. De plus, nous avons développé un cadre d'apprentissage multitâche équipé d'un mécanisme de copie, appelé CopyMTL, permettant au modèle de prédire des entités composées de plusieurs tokens. Les expériences mettent en évidence les problèmes de CopyRE et montrent que notre modèle réalise une amélioration significative par rapport à la méthode actuelle la plus avancée, avec une augmentation de 9 % sur le jeu de données NYT et de 16 % sur WebNLG (score F1). Notre code est disponible sur https://github.com/WindChimeRan/CopyMTL.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
CopyMTL : Mécanisme de copie pour l'extraction conjointe d'entités et de relations avec l'apprentissage multi-tâches | Articles | HyperAI