SpEL : Prédiction Structurée pour le Liage d'Entités

Le lien d'entités est une ligne de recherche importante axée sur la création de données structurées en reliant des segments de texte à une ontologie ou une source de connaissances. Nous reprenons l'utilisation de la prédiction structurée pour le lien d'entités, qui consiste à classifier chaque jeton d'entrée individuel comme étant une entité et à agréger les prédictions de jetons. Notre système, appelé SpEL (Structured prediction for Entity Linking), est un système de lien d'entités de pointe qui utilise certaines nouvelles idées pour appliquer la prédiction structurée à la tâche de lien d'entités, notamment : deux étapes de fine-tuning affinées ; une stratégie d'agrégation des prédictions sensible au contexte ; la réduction de la taille du vocabulaire de sortie du modèle ; et nous abordons un problème courant dans les systèmes de lien d'entités où il existe un décalage entre la tokenisation lors de l'apprentissage et celle lors de l'inférence. Nos expériences montrent que nous pouvons surpasser l'état de l'art sur l'ensemble de données AIDA largement utilisé pour le lien d'entités vers Wikipédia. Notre méthode est également très efficace en termes de nombre de paramètres et de vitesse d'inférence.