HyperAIHyperAI
il y a 2 mois

Réseaux de Neurones Convolutifs pour la Classification des Phrases

Yoon Kim
Réseaux de Neurones Convolutifs pour la Classification des Phrases
Résumé

Nous rapportons une série d'expériences menées avec des réseaux de neurones convolutifs (CNN) formés sur la base de vecteurs de mots pré-entraînés pour des tâches de classification au niveau des phrases. Nous montrons qu'un CNN simple, avec peu d'ajustement des hyperparamètres et des vecteurs statiques, obtient d'excellents résultats sur plusieurs benchmarks. L'apprentissage de vecteurs spécifiques à la tâche par le biais du fine-tuning offre des améliorations supplémentaires en termes de performance. Nous proposons également une modification simple de l'architecture afin de permettre l'utilisation à la fois de vecteurs spécifiques à la tâche et de vecteurs statiques. Les modèles CNN présentés ici surpassent l'état de l'art dans 4 des 7 tâches étudiées, qui incluent l'analyse de sentiment et la classification des questions.

Réseaux de Neurones Convolutifs pour la Classification des Phrases | Articles de recherche récents | HyperAI