HyperAIHyperAI
il y a 2 mois

Une approche multi-tâches pour la reconnaissance d'entités nommées dans les données des médias sociaux

Gustavo Aguilar; Suraj Maharjan; Adrian Pastor López-Monroy; Thamar Solorio
Une approche multi-tâches pour la reconnaissance d'entités nommées dans les données des médias sociaux
Résumé

La reconnaissance d'entités nommées (NER) dans les données des médias sociaux est un défi en raison de leur nature intrinsèquement bruyante. En plus des structures grammaticales impropres, ces données contiennent des incohérences orthographiques et de nombreuses abréviations informelles. Nous proposons une nouvelle approche multi-tâches en utilisant une tâche secondaire plus générale de segmentation d'entités nommées (NE) conjointement avec la tâche principale de catégorisation fine-grained des NE. L'architecture du réseau neuronal multi-tâches apprend des représentations de caractéristiques d'ordre supérieur à partir de séquences de mots et de caractères, ainsi que des étiquettes de base de type Part-of-Speech et des informations tirées de listes géographiques. Ce réseau neuronal agit comme un extracteur de caractéristiques pour alimenter un classifieur basé sur les champs aléatoires conditionnels (Conditional Random Fields). Nous avons obtenu la première place lors du 3ème Atelier sur le texte utilisateur bruyant (WNUT-2017) avec un score F1 d'entité de 41,86 % et un score F1 superficiel de 40,24 %.

Une approche multi-tâches pour la reconnaissance d'entités nommées dans les données des médias sociaux | Articles de recherche récents | HyperAI