HyperAIHyperAI
il y a 2 mois

Extraction de relations au niveau du document avec peu d'exemples

Nicholas Popovic; Michael Färber
Extraction de relations au niveau du document avec peu d'exemples
Résumé

Nous présentons FREDo, un benchmark pour l'extraction de relations à partir de documents avec peu d'exemples (FSDLRE). Contrairement aux benchmarks existants qui sont construits sur des corpus d'extraction de relations au niveau des phrases, nous soutenons que les corpus au niveau des documents offrent une plus grande réalisme, en particulier concernant les distributions « none-of-the-above » (NOTA). Par conséquent, nous proposons un ensemble de tâches FSDLRE et construisons un benchmark basé sur deux ensembles de données existants pour l'apprentissage supervisé, DocRED et sciERC. Nous adaptons la méthode au niveau des phrases la plus avancée actuellement, MNAV, au niveau des documents et la développons davantage pour améliorer l'adaptation de domaine. Nous constatons que le cadre FSDLRE est un environnement difficile présentant de nouvelles caractéristiques intéressantes, telles que la possibilité d'échantillonner des instances NOTA à partir du jeu de support. Les données, le code et les modèles entraînés sont disponibles en ligne (https://github.com/nicpopovic/FREDo).

Extraction de relations au niveau du document avec peu d'exemples | Articles de recherche récents | HyperAI