Prédiction des liens manquants à l'aide d'informations locales

La prédiction des liens manquants dans les réseaux revêt à la fois un intérêt théorique et une importance pratique en sciences modernes. Dans cet article, nous étudions empiriquement un cadre simple de prédiction de liens fondé sur la similarité entre nœuds. Nous comparons neuf mesures locales de similarité bien connues sur six réseaux réels. Les résultats indiquent que la mesure la plus simple, à savoir le nombre de voisins communs, obtient la meilleure performance globale, tandis que l’indice d’Adamic-Adar se classe au deuxième rang. Nous proposons une nouvelle mesure de similarité, inspirée du processus d’allocation de ressources sur les réseaux, et démontrons qu’elle offre une précision de prédiction supérieure à celle du nombre de voisins communs. Nous constatons que de nombreux liens reçoivent des scores identiques lorsqu’on utilise uniquement les informations provenant des voisins immédiats. Nous concevons donc une autre mesure nouvelle, exploitant les informations des voisins du second ordre, qui permet d’améliorer significativement la précision de la prédiction.