il y a 2 mois

HyperAggregation : Agrégation sur les arêtes de graphe avec des hyper-réseaux

Nicolas Lell; Ansgar Scherp

Résumé

HyperAggregation est une fonction d'agrégation basée sur les hyper-réseaux pour les Graph Neural Networks (réseaux neuronaux de graphe). Elle utilise un hyper-réseau pour générer dynamiquement des poids en fonction de la taille du voisinage actuel, qui sont ensuite utilisés pour agréger ce voisinage. Cette agrégation avec les poids générés est effectuée comme un mélange de canaux dans un MLP-Mixer, mais sur des voisinages de sommets de tailles variables. Nous démontrons l'utilisation de HyperAggregation dans deux modèles : GraphHyperMixer, qui est basé sur le MLP-Mixer, et GraphHyperConv, qui est dérivé d'un GCN (Graph Convolutional Network) mais intègre une fonction d'agrégation basée sur les hyper-réseaux. Nous menons des expériences sur divers ensembles de données de référence pour les tâches de classification de sommets, de classification de graphes et de régression de graphes. Les résultats montrent que HyperAggregation peut être utilisée efficacement pour des ensembles de données homophiles et hétérophiles, tant dans des configurations inductives que transductives. GraphHyperConv se montre supérieur à GraphHyperMixer et particulièrement performant dans le cadre transductif. Sur l'ensemble de données hétérophile Roman-Empire, il atteint un nouveau niveau d'état de l'art. Pour les tâches au niveau du graphe, nos modèles se comparent favorablement à des modèles similaires en termes de taille. Des études d'ablation examinent la robustesse face à différents choix d'hyperparamètres. L'implémentation de HyperAggregation ainsi que le code permettant de reproduire toutes les expériences sont disponibles sous https://github.com/Foisunt/HyperAggregation .