Réseaux de neurones convolutifs récurrents pour la classification de texte
La classification de texte est une tâche fondamentale dans de nombreuses applications de traitement du langage naturel (NLP). Les classificateurs traditionnels de texte s'appuient souvent sur de nombreuses caractéristiques conçues manuellement, telles que des dictionnaires, des bases de connaissances ou des noyaux arborescents spécifiques. À la différence des méthodes traditionnelles, nous proposons un réseau de neurones récurrent convolutif pour la classification de texte, sans recourir à des caractéristiques conçues par l'humain. Dans notre modèle, nous appliquons une structure récurrente afin de capturer au mieux l'information contextuelle lors de l'apprentissage des représentations des mots, ce qui peut introduire une quantité considérablement moindre de bruit par rapport aux réseaux neuronaux basés sur une fenêtre traditionnelle. Nous utilisons également une couche de max-pooling qui permet automatiquement d’identifier les mots jouant un rôle clé dans la classification de texte, afin de capturer les composantes essentielles des documents. Nous menons des expérimentations sur quatre jeux de données couramment utilisés. Les résultats expérimentaux montrent que la méthode proposée dépasse les meilleures méthodes actuelles sur plusieurs jeux de données, en particulier sur les jeux de données au niveau du document.