HyperAIHyperAI
il y a 2 mois

Apprentissage à Grande Échelle sur des Graphes Non-Homophiles : Nouveaux Benchmarks et Méthodes Simples mais Puissantes

Derek Lim; Felix Hohne; Xiuyu Li; Sijia Linda Huang; Vaishnavi Gupta; Omkar Bhalerao; Ser-Nam Lim
Apprentissage à Grande Échelle sur des Graphes Non-Homophiles : Nouveaux Benchmarks et Méthodes Simples mais Puissantes
Résumé

De nombreux ensembles de données largement utilisés pour les tâches d'apprentissage automatique sur les graphes ont généralement été homophiles, où les nœuds portant des étiquettes similaires sont connectés entre eux. Récemment, de nouvelles Réseaux Neuronaux sur Graphes (GNNs) ont été développés qui dépassent le régime d'homophilie ; cependant, leur évaluation a souvent été réalisée sur de petits graphes avec des domaines d'application limités. Nous avons rassemblé et introduit une variété d'ensembles de données non homophiles provenant de divers domaines d'application, qui comptent jusqu'à 384 fois plus de nœuds et 1398 fois plus d'arêtes que les ensembles de données précédents. Nous montrons également que les techniques existantes d'apprentissage à grande échelle sur les graphes et de minibatch sur les graphes entraînent une dégradation des performances sur ces ensembles de données non homophiles, soulignant ainsi la nécessité de travailler davantage sur des méthodes non homophiles à grande échelle. Pour répondre à ces préoccupations, nous présentons LINKX -- une méthode simple mais puissante qui permet un entraînement et une inférence par minibatch directe. Des résultats expérimentaux approfondis avec des méthodes simples représentatives et des GNNs sur nos ensembles de données proposés montrent que LINKX atteint des performances de pointe pour l'apprentissage sur des graphes non homophiles. Nos codes et données sont disponibles à l'adresse suivante : https://github.com/CUAI/Non-Homophily-Large-Scale.