HyperAIHyperAI
il y a 3 mois

Mixup pour la classification de nœuds et de graphes

{Bryan Hooi, Yujun Cai, Yuxuan Liang, Wei Wang, Yiwei Wang}
Mixup pour la classification de nœuds et de graphes
Résumé

Mixup est une méthode avancée d’augmentation de données pour l’entraînement de classificateurs d’images basés sur les réseaux de neurones, qui consiste à interpoler à la fois les caractéristiques et les étiquettes de paires d’images afin de générer des échantillons synthétiques. Toutefois, la conception de méthodes Mixup pour l’apprentissage sur graphes s’avère difficile en raison de l’irrégularité et de la connectivité inhérentes aux données graphes. Dans ce travail, nous proposons des méthodes Mixup pour deux tâches fondamentales dans l’apprentissage sur graphes : la classification de nœuds et la classification de graphes. Pour interpoler la topologie graphique irrégulière, nous introduisons une convolution graphique à deux branches, permettant de combiner les sous-graphes de champ réceptif associés à des paires de nœuds. L’interpolation effectuée sur différentes paires de nœuds peut entraîner une interférence entre les caractéristiques mélangées, en raison des connexions entre les nœuds. Pour bloquer cette interférence, nous proposons un cadre Mixup en deux étapes, qui utilise les représentations des voisins de chaque nœud avant l’opération de Mixup pour les convolutions graphiques. Pour la classification de graphes, nous effectuons l’interpolation de graphes complexes et diversifiés dans l’espace sémantique. Qualitativement, nos méthodes Mixup permettent aux GNN (Graph Neural Networks) d’apprendre des caractéristiques plus discriminantes et de réduire le surajustement. Les résultats quantitatifs montrent que notre méthode améliore de manière cohérente la précision sur les données de test et les scores F1-micro sur des jeux de données standards, pour les deux tâches de classification de nœuds et de classification de graphes. Globalement, notre approche régularise efficacement les réseaux de neurones graphiques populaires, améliorant ainsi leur généralisation, sans augmenter leur complexité temporelle.