HyperAIHyperAI
il y a 2 mois

Réseaux de convolution graphique pour la classification de texte

Liang Yao; Chengsheng Mao; Yuan Luo
Réseaux de convolution graphique pour la classification de texte
Résumé

La classification de texte est un problème important et classique dans le traitement automatique des langues naturelles. De nombreuses études ont appliqué des réseaux neuronaux convolutifs (CNN) à la classification, en utilisant la convolution sur une grille régulière, par exemple une séquence. Cependant, seules quelques études ont exploré les réseaux neuronaux convolutifs sur graphe (GCN), qui permettent une convolution sur une structure non-grillée, comme un graphe arbitraire, pour cette tâche.Dans ce travail, nous proposons d'utiliser des réseaux neuronaux convolutifs sur graphe pour la classification de texte. Nous construisons un seul graphe de texte pour un corpus en nous basant sur les cooccurrences de mots et les relations entre les mots et les documents. Ensuite, nous apprenons un Réseau Neuronal Convolutif sur Graphe de Texte (Text GCN) pour ce corpus. Notre Text GCN est initialisé avec une représentation one-hot pour les mots et les documents ; il apprend ensuite conjointement les plongements (embeddings) des mots et des documents, supervisés par les étiquettes de classe connues des documents.Nos résultats expérimentaux sur plusieurs jeux de données de référence montrent qu'un Text GCN simple sans aucun plongement lexical externe ou connaissance supplémentaire surpassent les méthodes d'avant-garde pour la classification de texte. Par ailleurs, le Text GCN apprend également des plongements prédictifs pour les mots et les documents. De plus, nos résultats expérimentaux indiquent que l'amélioration du Text GCN par rapport aux méthodes comparatives d'avant-garde devient plus marquée lorsque nous réduisons le pourcentage de données d'entraînement, suggérant ainsi la robustesse du Text GCN face à une quantité moindre de données d'entraînement dans la classification de texte.

Réseaux de convolution graphique pour la classification de texte | Articles de recherche récents | HyperAI