HyperAIHyperAI
il y a 9 jours

Liens d'entités auto-régressifs multilingues

Nicola De Cao, Ledell Wu, Kashyap Popat, Mikel Artetxe, Naman Goyal, Mikhail Plekhanov, Luke Zettlemoyer, Nicola Cancedda, Sebastian Riedel, Fabio Petroni
Liens d'entités auto-régressifs multilingues
Résumé

Nous présentons mGENRE, un système séquence-à-séquence pour le problème d’association d’entités multilingue (MEL), qui consiste à lier des mentions spécifiques à une langue à une base de connaissances multilingue (KB). Pour une mention donnée dans une langue spécifique, mGENRE prédit le nom de l’entité cible de manière autoregressive, de gauche à droite, mot après mot. Cette formulation autoregressive permet une encodage croisé efficace entre la chaîne de mention et les noms d’entités, capturant ainsi plus d’interactions que le produit scalaire standard entre les vecteurs de mention et d’entité. Elle permet également une recherche rapide au sein d’une grande base de connaissances, même pour des mentions n’apparaissant pas dans les tables de mentions, sans nécessiter d’indices vectoriels à grande échelle. Contrairement aux travaux antérieurs qui utilisent une seule représentation par entité, nous comparons les mentions aux noms d’entités dans autant de langues que possible, exploitant ainsi les liens linguistiques entre l’entrée source et le nom cible. En outre, dans un cadre zéro-shot pour des langues ne disposant d’aucune donnée d’entraînement, mGENRE traite la langue cible comme une variable latente, marginalisée au moment de la prédiction. Cela conduit à une amélioration moyenne de performance dépassant 50 %. Nous démontrons l’efficacité de notre approche à travers une évaluation approfondie, incluant des expérimentations sur trois benchmarks populaires de MEL, où mGENRE établit de nouveaux records d’état de l’art. Le code et les modèles pré-entraînés sont disponibles à l’adresse suivante : https://github.com/facebookresearch/GENRE.