Intégration profonde de réseaux structurés

L’embedding de réseau est une méthode importante permettant d’apprendre des représentations à faible dimension des sommets dans les réseaux, dans le but de capturer et de préserver la structure du réseau. Presque toutes les méthodes d’embedding de réseau existantes reposent sur des modèles peu profonds. Toutefois, en raison de la complexité intrinsèque de la structure sous-jacente des réseaux, les modèles peu profonds ne parviennent pas à capturer efficacement la structure hautement non linéaire des réseaux, ce qui conduit à des représentations sous-optimales. Par conséquent, trouver une méthode capable de capturer de manière efficace la structure hautement non linéaire tout en préservant à la fois la structure locale et globale reste un problème ouvert mais crucial. Pour résoudre ce problème, nous proposons dans cet article une méthode d’embedding de réseau profond structuré, nommée SDNE (Structural Deep Network Embedding). Plus précisément, nous introduisons tout d’abord un modèle profond semi-supervisé comportant plusieurs couches de fonctions non linéaires, permettant ainsi de modéliser efficacement la structure hautement non linéaire des réseaux. Ensuite, nous proposons d’exploiter conjointement la proximité d’ordre un et la proximité d’ordre deux afin de préserver la structure du réseau. La proximité d’ordre deux est utilisée par le composant non supervisé pour capturer la structure globale du réseau, tandis que la proximité d’ordre un est utilisée comme information supervisée dans le composant supervisé afin de préserver la structure locale. En optimisant conjointement ces deux composantes au sein du modèle profond semi-supervisé, notre méthode parvient à préserver à la fois la structure locale et la structure globale du réseau, tout en étant robuste aux réseaux creux. Expérimentalement, nous avons mené des évaluations sur cinq réseaux réels, incluant un réseau linguistique, un réseau de citations et trois réseaux sociaux. Les résultats montrent que, par rapport aux méthodes de référence, notre approche permet une reconstruction significativement meilleure du réseau d’origine et obtient des gains substantiels dans trois applications : la classification multi-étiquettes, la prédiction de liens et la visualisation.