Command Palette
Search for a command to run...
Intégration de mots orientée vers la tâche pour la classification de texte
Intégration de mots orientée vers la tâche pour la classification de texte
He-Yan Huang Yang Gao Qian Liu Yuxin Tian Xiaochi Wei Luyang Liu
Résumé
La représentation distribuée des mots joue un rôle fondamental dans diverses tâches de traitement du langage naturel. Malgré ses succès, la plupart des méthodes existantes ne prennent en compte que l’information contextuelle, ce qui s’avère sous-optimale lorsqu’elles sont appliquées à différentes tâches en raison du manque de caractéristiques spécifiques à la tâche. Les embeddings de mots rationnels devraient être capables de capturer à la fois les caractéristiques sémantiques et les caractéristiques spécifiques à la tâche des mots. Dans cet article, nous proposons une méthode d’embedding de mots orientée vers la tâche et l’appliquons à la classification de texte. Grâce à un composant sensible à la fonction, notre méthode régularise la distribution des mots afin de permettre à l’espace d’embeddings d’acquérir une frontière de classification claire. Nous évaluons notre méthode sur cinq jeux de données de classification de texte. Les résultats expérimentaux montrent que notre approche surpasse significativement les méthodes de pointe actuelles.