Complétion inductive de matrices utilisant un autoencodeur graphique

Récemment, les réseaux de neurones sur graphes (GNN) ont démontré un grand pouvoir dans la complétion de matrices en modélisant une matrice d’évaluations sous la forme d’un graphe biparti, puis en prédisant les liens entre les nœuds correspondant aux utilisateurs et aux articles. La majorité des méthodes de complétion de matrices basées sur les GNN s’appuient sur l’Autoencodeur de graphe (GAE), qui prend comme entrée l’indice one-hot, mappe l’indice d’un utilisateur (ou d’un article) vers une représentation apprenable, applique un GNN pour apprendre des représentations spécifiques aux nœuds à partir de ces embeddings apprenables, puis agrège les représentations de l’utilisateur cible et de son article correspondant afin de prédire les liens manquants. Toutefois, en l’absence de contenu de nœud (c’est-à-dire d’informations complémentaires) pour l’entraînement, les représentations spécifiques aux utilisateurs (ou aux articles) ne peuvent pas être apprises dans un cadre inductif, c’est-à-dire qu’un modèle entraîné sur un groupe d’utilisateurs (ou d’articles) ne peut pas s’adapter à de nouveaux utilisateurs (ou articles). À cette fin, nous proposons une méthode inductive de complétion de matrices utilisant le GAE (IMC-GAE), qui exploite le GAE pour apprendre à la fois les représentations spécifiques aux utilisateurs (ou aux articles) pour des recommandations personnalisées et les motifs locaux de graphe pour une complétion de matrices inductive. Plus précisément, nous concevons deux caractéristiques de nœud informatives et mettons en œuvre une stratégie de suppression de nœuds par couche dans le GAE afin d’apprendre des motifs locaux de graphe généralisables à des données inconnues. La contribution principale de notre travail réside dans la capacité à apprendre efficacement des motifs locaux de graphe dans le cadre du GAE, offrant une bonne scalabilité et une expressivité supérieure par rapport aux méthodes précédentes basées sur les GNN pour la complétion de matrices. En outre, des expérimentations étendues montrent que notre modèle atteint des performances de pointe sur plusieurs benchmarks de complétion de matrices. Le code officiel de notre modèle est disponible publiquement.