Plongement de requêtes logiques sur les graphes de connaissances

L'apprentissage de plongements de faible dimension des graphes de connaissances est une approche puissante utilisée pour prédire les arêtes non observées ou manquantes entre les entités. Cependant, un défi ouvert dans ce domaine est le développement de techniques capables d'aller au-delà de la prédiction simple d'arêtes et de gérer des requêtes logiques plus complexes, qui peuvent impliquer plusieurs arêtes non observées, entités et variables. Par exemple, étant donné un graphe de connaissances biologiques incomplet, nous pourrions vouloir prédire « quels médicaments sont susceptibles de cibler des protéines impliquées dans les maladies X et Y ? » -- une requête qui nécessite de raisonner sur toutes les protéines possibles qui {\em pourraient} interagir avec les maladies X et Y. Ici, nous présentons un cadre permettant d'effectuer efficacement des prédictions sur des requêtes logiques conjonctives -- un sous-ensemble flexible mais traitable du premier ordre -- dans des graphes de connaissances incomplets. Dans notre approche, nous plongeons les nœuds du graphe dans un espace de faible dimension et représentons les opérateurs logiques comme des opérations géométriques apprises (par exemple, translation, rotation) dans cet espace de plongement. En effectuant des opérations logiques dans un espace de plongement de faible dimension, notre approche atteint une complexité temporelle linéaire en fonction du nombre de variables de la requête, contrairement à la complexité exponentielle requise par une approche basée sur l'énumération naïve. Nous démontrons l'utilité de ce cadre dans deux études d'application sur des jeux de données réels comportant des millions de relations : la prédiction de relations logiques dans un réseau d'interactions médicament-gène-maladie et dans une représentation graphique basée sur des interactions sociales issues d'un forum web populaire.