Réseau neuronal à graphes au niveau du texte pour la classification de texte

Récemment, les recherches se sont intéressées aux techniques de réseaux de neurones sur graphes (GNN) pour la classification de texte, car les GNN se distinguent par leur capacité à traiter des structures complexes tout en préservant les informations globales. Toutefois, les méthodes antérieures fondées sur les GNN sont principalement confrontées à des problèmes pratiques, notamment la structure de graphe fixe au niveau du corpus, qui ne permet pas de tester en ligne, ainsi qu’à une consommation mémoire élevée. Pour résoudre ces limites, nous proposons un nouveau modèle basé sur les GNN, qui construit un graphe pour chaque texte d’entrée en partageant des paramètres globaux, plutôt que de définir un seul graphe pour l’ensemble du corpus. Cette approche élimine la dépendance entre un texte individuel et le corpus entier, permettant ainsi des tests en ligne, tout en conservant efficacement les informations globales. Par ailleurs, nous construisons les graphes à l’aide de fenêtres beaucoup plus réduites dans le texte, ce qui permet non seulement d’extraire davantage de caractéristiques locales, mais aussi de réduire significativement le nombre d’arêtes et la consommation mémoire. Les expériences montrent que notre modèle surpasse les modèles existants sur plusieurs jeux de données de classification de texte, tout en consommant moins de mémoire.