Les GNN peuvent-ils apprendre des heuristiques de lien ? Un bref examen et évaluation des méthodes de prédiction de lien

Cet article explore la capacité des réseaux de neurones sur graphes (GNN) à apprendre diverses formes d’information pour la prédiction de liens, tout en proposant un bref état de l’art des méthodes existantes de prédiction de liens. Notre analyse révèle que les GNN ne parviennent pas efficacement à apprendre l’information structurelle liée au nombre de voisins communs entre deux nœuds, principalement en raison de la nature du pooling basé sur des ensembles adoptée dans le schéma d’agrégation des voisins. Par ailleurs, nos expérimentations approfondies indiquent que des embeddings de nœuds ajustables peuvent améliorer significativement les performances des modèles de prédiction de liens basés sur les GNN. De façon importante, nous observons que plus le graphe est dense, plus cet amélioration est marquée. Nous attribuons ce phénomène aux caractéristiques des embeddings de nœuds, selon lesquels l’état d’un lien dans un échantillon de lien peut être encodé dans les embeddings des nœuds impliqués dans l’agrégation de voisinage des deux nœuds du lien. Dans les graphes denses, chaque nœud dispose de plus d’occasions d’interagir dans l’agrégation de voisinage d’autres nœuds, ce qui lui permet d’encoder l’état de plus d’échantillons de liens dans son propre embedding, conduisant ainsi à des embeddings de nœuds plus pertinents pour la prédiction de liens. Enfin, nous démontrons que les insights issus de cette recherche ont des implications importantes pour identifier les limites des méthodes existantes de prédiction de liens, pouvant ainsi guider le développement futur d’algorithmes plus robustes.