HyperAIHyperAI
il y a 3 mois

Eider : Autonomiser l'extraction de relations à l'échelle du document grâce à une extraction efficace des preuves et à une fusion en phase d'inférence

Yiqing Xie, Jiaming Shen, Sha Li, Yuning Mao, Jiawei Han
Eider : Autonomiser l'extraction de relations à l'échelle du document grâce à une extraction efficace des preuves et à une fusion en phase d'inférence
Résumé

L'extraction de relations à l'échelle du document (DocRE) vise à extraire les relations sémantiques entre les paires d'entités présentes dans un document. Les méthodes classiques de DocRE traitent l'intégralité du document comme entrée, alors qu'en réalité, un sous-ensemble de phrases — que nous appelons « preuves » — est souvent suffisant pour qu’un humain prédise la relation entre une paire d’entités. Dans cet article, nous proposons un cadre amélioré par les preuves, appelé Eider, qui renforce la performance de la DocRE grâce à une extraction efficace des preuves et une fusion efficace de celles-ci lors de l’inférence. Nous entraînons d’abord conjointement un modèle de extraction de relations (RE) avec un modèle léger d’extraction de preuves, ce qui permet une efficacité élevée en mémoire et en temps d’exécution. Expérimentalement, même l’entraînement du modèle d’extraction de preuves à partir d’étiquettes « silver » générées par nos règles heuristiques conduit à une amélioration des performances en RE. Nous avons également conçu un processus d’inférence simple mais efficace, qui effectue des prédictions RE à la fois sur les preuves extraites et sur l’intégralité du document, puis fusionne ces prédictions via une couche de combinaison (blending layer). Cette approche permet à Eider de se concentrer sur les phrases les plus pertinentes tout en conservant l’accès à l’information complète du document. Des expérimentations étendues montrent que Eider surpasser les méthodes de pointe sur trois jeux de données standard (par exemple, +1,37 / +1,26 en F1 ignorée/F1 sur DocRED).