Command Palette
Search for a command to run...
Augmentation de données pour les réseaux de neurones sur graphes
Augmentation de données pour les réseaux de neurones sur graphes
Tong Zhao Yozen Liu Leonardo Neves Oliver Woodford Meng Jiang Neil Shah
Résumé
L’augmentation de données est largement utilisée pour améliorer la généralisation des modèles d’apprentissage automatique. Toutefois, peu de travaux se sont intéressés à l’augmentation de données pour les graphes. Cette situation est principalement due à la structure complexe et non euclidienne des graphes, qui restreint les opérations de manipulation possibles. Les opérations d’augmentation couramment utilisées en vision par ordinateur et en traitement du langage naturel n’ont pas d’équivalents directs pour les graphes. Ce travail explore l’augmentation de données pour les graphes dans le cadre de l’amélioration de la classification de nœuds semi-supervisée par les réseaux de neurones sur graphes (GNN). Nous présentons des motivations pratiques et théoriques, ainsi que des considérations et des stratégies spécifiques à l’augmentation de données pour les graphes. Nos résultats montrent que des prédicteurs neuronaux d’arêtes peuvent efficacement encoder la structure d’homophilie par classe, favorisant ainsi les arêtes intra-classe tout en réduisant celles inter-classe dans une structure de graphe donnée. Notre contribution principale introduit le cadre d’augmentation de données GAug, qui exploite ces observations pour améliorer les performances des modèles de classification de nœuds basés sur les GNN via une prédiction d’arêtes. Des expériences étendues sur plusieurs benchmarks démontrent que l’augmentation par GAug améliore les performances sur diverses architectures de GNN et jeux de données.