HyperAIHyperAI
il y a 4 mois

Enrichissement d'un modèle de langage pré-entraîné avec des informations d'entité pour la classification des relations

Shanchan Wu; Yifan He
Enrichissement d'un modèle de langage pré-entraîné avec des informations d'entité pour la classification des relations
Résumé

La classification des relations est une tâche importante en traitement automatique du langage naturel (TALN) visant à extraire les relations entre entités. Les méthodes les plus avancées pour la classification des relations sont principalement basées sur des réseaux neuronaux convolutionnels ou récurrents. Récemment, le modèle pré-entraîné BERT a obtenu des résultats très prometteurs dans de nombreuses tâches de classification et d'étiquetage séquentiel en TALN. La classification des relations diffère de ces tâches en ce qu'elle repose sur l'information contenue à la fois dans la phrase et dans les deux entités cibles. Dans cet article, nous proposons un modèle qui utilise à la fois le modèle linguistique pré-entraîné BERT et intègre l'information provenant des entités cibles pour aborder la tâche de classification des relations. Nous localisons les entités cibles et transférons l'information à travers l'architecture pré-entraînée, tout en incorporant le codage correspondant des deux entités. Nous obtenons une amélioration significative par rapport aux méthodes les plus avancées sur l'ensemble de données relationnel SemEval-2010 Task 8.