Faisons-nous vraiment beaucoup de progrès ? Réexamen, évaluation et affinage des réseaux neuronaux hétérogènes pour les graphes

Les réseaux neuronaux sur graphes hétérogènes (HGNNs) ont connu un essor considérable ces dernières années, mais les configurations de traitement et d'évaluation de données uniques utilisées par chaque étude entravent une compréhension complète de leurs avancées. Dans ce travail, nous présentons une reproduction systématique de 12 HGNNs récents en utilisant leurs codes officiels, leurs jeux de données, leurs paramètres et leurs hyperparamètres, révélant des constatations surprenantes concernant les progrès des HGNNs. Nous découvrons que les simples réseaux neuronaux sur graphes homogènes, tels que le GCN (Graph Convolutional Network) et le GAT (Graph Attention Network), sont largement sous-estimés en raison de paramètres inappropriés. Un GAT avec des entrées appropriées peut généralement égaler ou surpasser tous les HGNNs existants dans divers scénarios. Pour faciliter une recherche robuste et reproductible sur les HGNNs, nous avons construit le Heterogeneous Graph Benchmark (HGB), composé de 11 jeux de données variés avec trois tâches. L'HGB standardise le processus de division des données sur graphes hétérogènes, de traitement des caractéristiques et d'évaluation des performances. Enfin, nous introduisons un modèle de référence simple mais très performant appelé Simple-HGN--qui surpasse significativement tous les modèles précédents sur l'HGB--pour accélérer les progrès futurs des HGNNs.