HyperAIHyperAI
il y a 2 mois

Extraction de Relations d'Entités comme Question-Réponse Multitour

Xiaoya Li; Fan Yin; Zijun Sun; Xiayu Li; Arianna Yuan; Duo Chai; Mingxin Zhou; Jiwei Li
Extraction de Relations d'Entités comme Question-Réponse Multitour
Résumé

Dans cet article, nous proposons un nouveau paradigme pour la tâche d'extraction de relations d'entités. Nous reformulons cette tâche sous forme de problème de questions-réponses à plusieurs tours, c'est-à-dire que l'extraction des entités et des relations est transformée en une tâche d'identification des segments de réponse dans le contexte. Cette formalisation en QA à plusieurs tours présente plusieurs avantages clés : premièrement, la requête de question encode des informations importantes pour la classe d'entité/relation que nous souhaitons identifier ; deuxièmement, le QA offre une manière naturelle de modéliser conjointement les entités et les relations ; et troisièmement, elle nous permet d'exploiter les modèles bien développés de compréhension de lecture par machine (MRC). Les expériences menées sur les corpus ACE et CoNLL04 montrent que le paradigme proposé surpasse significativement les meilleurs modèles précédents. Nous sommes en mesure d'obtenir des résultats d'état de l'art sur l'ensemble des jeux de données ACE04, ACE05 et CoNLL04, améliorant les résultats SOTA sur ces trois jeux de données à 49,4 (+1,0), 60,2 (+0,6) et 68,9 (+2,1), respectivement. De plus, nous avons construit un nouveau jeu de données RESUME en chinois, qui nécessite un raisonnement à plusieurs étapes pour établir les dépendances entre entités, contrairement à l'extraction de dépendances en une seule étape dans l'extraction de triplets des jeux de données précédents. Le modèle QA à plusieurs tours proposé atteint également les meilleures performances sur le jeu de données RESUME.