HyperAIHyperAI

Command Palette

Search for a command to run...

Une approche multi-tâches pour la reconnaissance d'entités nommées dans les données des médias sociaux

Gustavo Aguilar; Suraj Maharjan; Adrian Pastor López-Monroy; Thamar Solorio

Résumé

La reconnaissance d'entités nommées (NER) dans les données des médias sociaux est un défi en raison de leur nature intrinsèquement bruyante. En plus des structures grammaticales impropres, ces données contiennent des incohérences orthographiques et de nombreuses abréviations informelles. Nous proposons une nouvelle approche multi-tâches en utilisant une tâche secondaire plus générale de segmentation d'entités nommées (NE) conjointement avec la tâche principale de catégorisation fine-grained des NE. L'architecture du réseau neuronal multi-tâches apprend des représentations de caractéristiques d'ordre supérieur à partir de séquences de mots et de caractères, ainsi que des étiquettes de base de type Part-of-Speech et des informations tirées de listes géographiques. Ce réseau neuronal agit comme un extracteur de caractéristiques pour alimenter un classifieur basé sur les champs aléatoires conditionnels (Conditional Random Fields). Nous avons obtenu la première place lors du 3ème Atelier sur le texte utilisateur bruyant (WNUT-2017) avec un score F1 d'entité de 41,86 % et un score F1 superficiel de 40,24 %.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp