ReFinED : Une approche efficace et capable de zero-shot pour le lien d'entité de bout en bout

Nous présentons ReFinED, un modèle de liaison d'entités efficace et intégré qui utilise des types d'entités détaillés et des descriptions d'entités pour effectuer la liaison. Ce modèle réalise la détection de mentions, le typage fin d'entités et la désambiguïsation d'entités pour toutes les mentions dans un document en une seule passe avant, ce qui le rend plus de 60 fois plus rapide que les approches existantes concurrentes. ReFinED dépasse également les performances de l'état de l'art sur des jeux de données standard de liaison d'entités avec une moyenne de 3,7 points F1. Le modèle est capable de généraliser à des bases de connaissances à grande échelle telles que Wikidata (qui contient 15 fois plus d'entités que Wikipédia) et peut effectuer la liaison d'entités sans supervision préalable (zero-shot). La combinaison de vitesse, de précision et d'échelle fait de ReFinED un système efficace et rentable pour extraire des entités à partir de jeux de données à l'échelle du Web, où il a été déployé avec succès. Notre code source et nos modèles pré-entraînés sont disponibles sur https://github.com/alexa/ReFinED.