DensE : Une représentation non-commutative améliorée pour l'intégration de graphes de connaissances avec une hiérarchie sémantique adaptative

La capture des motifs de composition des relations constitue une tâche essentielle dans le complément de graphes de connaissances, tout en représentant une étape fondamentale vers le raisonnement multi-étapes basé sur les connaissances apprises. Par le passé, plusieurs méthodes translationnelles basées sur des rotations ont été développées afin de modéliser les relations composées à l’aide du produit d’une série de matrices diagonales à valeurs complexes. Toutefois, ces approches reposent souvent sur des hypothèses simplificatrices excessives concernant les relations composées, par exemple en imposant leur commutativité, en les rendant indépendantes des entités, ou en négligeant toute hiérarchie sémantique inhérente. Pour traiter de manière systématique ces limitations, nous proposons une nouvelle méthode d’encodage des graphes de connaissances, nommée DensE, offrant un cadre amélioré pour modéliser les motifs complexes de composition des relations. Plus précisément, notre méthode décompose chaque relation en un opérateur de rotation basé sur le groupe SO(3) et un opérateur d’échelle dans l’espace euclidien à trois dimensions (3-D). Ce principe de conception confère plusieurs avantages à notre approche : (1) pour les relations composées, les matrices diagonales correspondantes peuvent être non commutatives, reflétant ainsi une situation prédominante dans les applications du monde réel ; (2) notre modèle préserve l’interaction naturelle entre les opérations relationnelles et les embeddings des entités ; (3) l’opération d’échelle permet de modéliser la structure hiérarchique sémantique intrinsèque des entités ; (4) l’expressivité accrue de DensE est obtenue avec une efficacité computationnelle élevée, tant en termes de taille des paramètres que de temps d’entraînement ; (5) le fait de modéliser les entités dans l’espace euclidien plutôt que dans l’espace des quaternions permet de conserver des interprétations géométriques directes des motifs relationnels. Les résultats expérimentaux sur plusieurs graphes de connaissances standards montrent que DensE surpasser les modèles les plus avancés actuellement disponibles pour la prédiction de liens manquants, en particulier dans le cas des relations composées.