HyperAIHyperAI
il y a 2 mois

ReLiK : Retrieve and Link, Un Système Rapide et Précis de Liaison d'Entités et d'Extraction de Relations à Coût Raisonnable pour les Établissements Universitaires

Orlando, Riccardo ; Cabot, Pere-Lluis Huguet ; Barba, Edoardo ; Navigli, Roberto
ReLiK : Retrieve and Link, Un Système Rapide et Précis de Liaison d'Entités et d'Extraction de Relations à Coût Raisonnable pour les Établissements Universitaires
Résumé

L'Entity Linking (EL) et l'extraction de relations (RE) sont des tâches fondamentales en traitement automatique des langues naturelles, servant de composants critiques dans une large gamme d'applications. Dans cet article, nous proposons ReLiK, une architecture Retriever-Reader pour l'EL et la RE, où, étant donné un texte d'entrée, le module Retriever s'occupe de l'identification des entités ou des relations candidates qui pourraient potentiellement apparaître dans le texte. Ensuite, le module Reader est chargé de discerner les entités ou relations pertinentes récupérées et d'établir leur alignement avec les segments textuels correspondants. Notamment, nous introduisons une représentation d'entrée innovante qui intègre les entités ou relations candidates à côté du texte, rendant possible le lien d'entités ou l'extraction de relations en un seul passage avant et permettant d'utiliser pleinement les capacités de contextualisation des modèles linguistiques pré-entraînés, contrairement aux méthodes précédentes basées sur une architecture Retriever-Reader, qui nécessitent un passage avant pour chaque candidat. Notre formulation de l'EL et de la RE atteint des performances de pointe dans les benchmarks intra-domaine et inter-domaine tout en utilisant un budget de formation académique et avec une vitesse d'inférence jusqu'à 40 fois supérieure à celle des concurrents. Enfin, nous montrons comment notre architecture peut être utilisée sans heurt pour l'extraction d'information (cIE), c'est-à-dire EL + RE, en établissant un nouveau standard grâce à l'utilisation d'un Reader partagé qui extrait simultanément les entités et les relations.