Apprentissage de représentation pour un réseau hétérogène multiplexe avec attributs

L'embedding de réseau (ou embedding de graphe) est largement utilisé dans de nombreuses applications réelles. Cependant, les méthodes existantes se concentrent principalement sur des réseaux à nœuds/aretes de type unique et ne peuvent pas bien s'adapter pour traiter des grands réseaux. De nombreux réseaux du monde réel comprennent des milliards de nœuds et d'arêtes de plusieurs types, chaque nœud étant associé à différents attributs. Dans cet article, nous formalisons le problème d'apprentissage d'embedding pour le réseau hétérogène multiplexe avec attributs (Attributed Multiplex Heterogeneous Network) et proposons un cadre unifié pour aborder ce problème. Ce cadre prend en charge tant l'apprentissage transductif que l'apprentissage inductif. Nous fournissons également une analyse théorique du cadre proposé, montrant son lien avec les travaux précédents et démontrant sa meilleure expressivité. Nous menons des évaluations systématiques du cadre proposé sur quatre genres différents de jeux de données complexes : Amazon, YouTube, Twitter et Alibaba. Les résultats expérimentaux montrent que grâce aux embeddings appris à partir du cadre proposé, nous pouvons réaliser des améliorations statistiquement significatives (par exemple, une augmentation de 5,99 % à 28,23 % selon les scores F1 ; p << 0,01, test t) par rapport aux méthodes les plus avancées précédentes pour la prédiction de liens. Le cadre a également été déployé avec succès dans le système de recommandation d'une entreprise mondiale leader du commerce électronique, le groupe Alibaba. Les résultats des tests A/B hors ligne sur la recommandation de produits confirment davantage l'efficacité et l'efficience du cadre en pratique.