HyperAIHyperAI
il y a 17 jours

FLERT : Fonctionnalités au niveau du document pour la reconnaissance d'entités nommées

Stefan Schweter, Alan Akbik
FLERT : Fonctionnalités au niveau du document pour la reconnaissance d'entités nommées
Résumé

Les approches actuelles de pointe pour la reconnaissance d'entités nommées (NER) considèrent généralement le texte au niveau de la phrase, et ne modélisent donc pas d'informations qui s'étendent au-delà des frontières des phrases. Toutefois, l'utilisation de modèles basés sur les transformateurs pour le NER offre naturellement des possibilités pour capturer des caractéristiques au niveau du document. Dans cet article, nous menons une évaluation comparative des caractéristiques au niveau du document dans deux architectures standards de NER fréquemment étudiées dans la littérature : la « fine-tuning » et l’approche « feature-based LSTM-CRF ». Nous évaluons différents hyperparamètres relatifs aux caractéristiques au niveau du document, tels que la taille de la fenêtre de contexte et l’imposition de la localité documentaire. À partir d’expériences menées, nous formulons des recommandations sur la manière de modéliser le contexte documentaire, et présentons de nouveaux résultats de pointe sur plusieurs jeux de données de référence CoNLL-03. Notre approche est intégrée dans le cadre Flair afin de faciliter la reproduction de nos expériences.