HyperAIHyperAI

Command Palette

Search for a command to run...

Un réseau neuronal C-LSTM pour la classification de texte

Chunting Zhou Chonglin Sun Zhiyuan Liu Francis C.M. Lau

Résumé

Les modèles de réseaux neuronaux ont démontré leur capacité à atteindre des performances remarquables dans la modélisation de phrases et de documents. Les réseaux neuronaux convolutifs (CNN) et les réseaux neuronaux récurrents (RNN) sont deux architectures principales utilisées pour ces tâches de modélisation, qui adoptent des méthodes totalement différentes pour comprendre les langues naturelles. Dans ce travail, nous combinons les forces de ces deux architectures et proposons un modèle novateur et unifié appelé C-LSTM pour la représentation des phrases et la classification du texte. Le C-LSTM utilise un CNN pour extraire une séquence de représentations phrastiques de niveau supérieur, qui est ensuite alimentée dans un réseau neuronal récurrent à mémoire à court et long terme (LSTM) afin d'obtenir la représentation de la phrase. Le C-LSTM est capable de capturer à la fois les caractéristiques locales des phrases ainsi que les sémantiques globales et temporelles des phrases. Nous évaluons l'architecture proposée sur des tâches de classification d'opinions et de questions. Les résultats expérimentaux montrent que le C-LSTM surpasses tant le CNN que le LSTM, et peut atteindre d'excellentes performances sur ces tâches.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Un réseau neuronal C-LSTM pour la classification de texte | Articles | HyperAI