L’association d’entités rencontre le sens des mots : une approche unifiée

L’identification d’entités (Entity Linking, EL) et la désambiguïsation des sens des mots (Word Sense Disambiguation, WSD) traitent toutes deux l’ambiguïté lexicale du langage. Bien que ces deux tâches soient très similaires, elles diffèrent fondamentalement : dans l’EL, une mention textuelle peut être associée à une entité nommée, qui peut ou non contenir exactement la mention, tandis que dans la WSD, il existe une correspondance parfaite entre la forme lexicale (ou mieux, son lemme) et un sens approprié du mot. Dans cet article, nous présentons Babelfy, une approche unifiée basée sur un graphe pour l’EL et la WSD, fondée sur une identification souple des sens candidats, combinée à une heuristique de sous-graphe denses permettant de sélectionner des interprétations sémantiques à forte cohérence. Nos expériences montrent des performances de pointe sur les deux tâches, sur six jeux de données différents, y compris dans un cadre multilingue. Babelfy est disponible en ligne à l’adresse http://babelfy.org.