HyperAIHyperAI
il y a 2 mois

Une approche séquence-à-séquence pour l’extraction de relations au niveau du document

John Giorgi; Gary D. Bader; Bo Wang
Une approche séquence-à-séquence pour l’extraction de relations au niveau du document
Résumé

Motivés par le fait que de nombreuses relations traversent les limites des phrases, il y a un intérêt croissant pour l'extraction de relations au niveau du document (DocRE). Le DocRE nécessite d'intégrer les informations à l'intérieur et entre les phrases, en capturant des interactions complexes entre les mentions d'entités. La plupart des méthodes existantes sont basées sur une chaîne de traitement, nécessitant des entités comme entrée. Cependant, l'apprentissage conjoint de l'extraction d'entités et de relations peut améliorer les performances et être plus efficace grâce aux paramètres et aux étapes d'entraînement partagés. Dans cet article, nous développons une approche séquence-à-séquence, seq2rel, capable d'apprendre les sous-tâches du DocRE (extraction d'entités, résolution de co-référence et extraction de relations) de bout en bout, remplaçant ainsi une chaîne de composants spécifiques à chaque tâche. En utilisant une stratégie simple que nous appelons « indication d'entité » (entity hinting), nous comparons notre approche aux méthodes existantes basées sur une chaîne de traitement sur plusieurs jeux de données biomédicaux populaires, dépassant leurs performances dans certains cas. Nous rapportons également les premiers résultats obtenus de bout en bout sur ces jeux de données pour permettre des comparaisons futures. Enfin, nous démontrons que, selon notre modèle, une approche de bout en bout surpasse une approche basée sur une chaîne de traitement. Notre code source, nos données et nos modèles entraînés sont disponibles à l'adresse {\url{https://github.com/johngiorgi/seq2rel}}. Une démonstration en ligne est accessible à l'adresse {\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}}.

Une approche séquence-à-séquence pour l’extraction de relations au niveau du document | Articles de recherche récents | HyperAI