HyperAIHyperAI
il y a 9 jours

Reconnaissance d'entités nommées pour le lien d'entités : ce qui fonctionne et les perspectives à venir

{Roberto Navigli, Francesco Cecconi, Simone Conia, Simone Tedeschi}
Reconnaissance d'entités nommées pour le lien d'entités : ce qui fonctionne et les perspectives à venir
Résumé

Les systèmes de Linking d'Entités (EL) ont atteint des résultats remarquables sur les benchmarks standards, principalement grâce aux représentations contextualisées fournies par les récents modèles linguistiques préentraînés. Toutefois, ces systèmes nécessitent encore d’importants volumes de données – des millions d’exemples étiquetés – pour atteindre leur plein potentiel, avec des temps d’entraînement pouvant dépasser plusieurs jours, en particulier lorsque les ressources informatiques sont limitées. Dans ce papier, nous examinons comment la Reconnaissance d'Entités Nominales (NER) peut être exploitée pour réduire l’écart entre les systèmes EL entraînés sur de grandes et de faibles quantités d’exemples étiquetés. Plus précisément, nous montrons comment et dans quelle mesure un système EL peut bénéficier de la NER afin d’améliorer ses représentations d’entités, de renforcer la sélection des candidats, de choisir des échantillons négatifs plus efficaces, et d’imposer des contraintes rigides et souples sur ses entités de sortie. Nous mettons à disposition notre logiciel – code source et points de contrôle de modèle – à l’adresse suivante : https://github.com/Babelscape/ner4el.