HyperAIHyperAI
il y a 2 mois

Classification de texte abstraite à l'aide de réseaux neuronaux séquence-à-convolutionnelle

Taehoon Kim; Jihoon Yang
Classification de texte abstraite à l'aide de réseaux neuronaux séquence-à-convolutionnelle
Résumé

Nous proposons un nouveau modèle de réseau neuronal profond et son schéma d'entraînement pour la classification de texte. Notre modèle, les Réseaux Neuronaux Séquence-à-Convolution (Seq2CNN), est composé de deux blocs : le Bloc Séquentiel qui résume les textes d'entrée et le Bloc de Convolution qui reçoit ce résumé et le classe dans une étiquette. Le Seq2CNN est entraîné de manière end-to-end pour classifier des textes de longueurs variées sans prétraitement des entrées en une longueur fixe. Nous présentons également la méthode du Décalage Progressif des Poids (GWS) qui stabilise l'entraînement. Le GWS est appliqué à la fonction de perte de notre modèle. Nous avons comparé notre modèle avec un TextCNN basé sur les mots, entraîné avec différentes méthodes de prétraitement des données. Nous avons obtenu une amélioration significative de la précision de classification par rapport au TextCNN basé sur les mots, sans aucune technique d'ensemble ou d'augmentation des données.

Classification de texte abstraite à l'aide de réseaux neuronaux séquence-à-convolutionnelle | Articles de recherche récents | HyperAI