InferNER : un modèle attentif exploitant les informations au niveau de la phrase pour la reconnaissance d'entités nommées dans les microblogs
Nous étudions le problème de la reconnaissance d'entités nommées (NER) dans les textes générés par les utilisateurs, tels que les publications sur les réseaux sociaux. Cette tâche est particulièrement difficile en raison de la longueur restreinte et de la faible cohérence grammaticale de ces données. Les approches actuelles les plus avancées s'appuient sur des sources externes, comme des gazetteers, afin de pallier certaines de ces limitations. Nous proposons un modèle neuronal capable de surpasser l'état de l'art sur cette tâche sans recourir à des gazetteers ni à d'autres sources d'information externes. Notre approche exploite des informations au niveau des mots, des caractères et des phrases pour la NER dans les textes courts. Les publications sur les réseaux sociaux, telles que les tweets, sont souvent associées à des images qui peuvent fournir un contexte auxiliaire pertinent pour comprendre ces textes. Par conséquent, nous intégrons également des informations visuelles et introduisons un composant d'attention qui calcule séparément les poids d'attention pour les contextes textuels et les contextes visuels pertinents. Notre modèle surpasse l'état de l'art actuel sur diverses bases de données NER. Sur les jeux de données WNUT 2016 et 2017, notre modèle atteint respectivement des scores F1 de 53,48 % et 50,52 %. Avec le modèle multimodal, notre système dépasse également l'état de l'art actuel, atteignant un score F1 de 74 % sur une base de données multimodale. Nos évaluations suggèrent également que notre modèle dépasse l'état de l'art sur les données de presse écrite, confirmant ainsi sa pertinence pour diverses tâches de NER.