Analyse des méthodes d'embedding de graphes de connaissances sous l'angle des interactions multi-embeddings

Le graphe de connaissances est un format populaire pour représenter les connaissances, avec de nombreuses applications dans les moteurs de recherche sémantiques, les systèmes de réponse aux questions et les systèmes de recommandation. Les graphes de connaissances du monde réel sont généralement incomplets, ce qui a conduit à la proposition de méthodes d'embedding de graphe de connaissances, telles que la décomposition canonique/factorisation parallèle (CP), DistMult et ComplEx, pour résoudre ce problème. Ces méthodes représentent les entités et les relations sous forme de vecteurs d'embedding dans l'espace sémantique et prédisent les liens entre elles. Les vecteurs d'embedding eux-mêmes contiennent des informations sémantiques riches et peuvent être utilisés dans d'autres applications telles que l'analyse des données. Cependant, les mécanismes au sein de ces modèles et les vecteurs d'embedding eux-mêmes varient considérablement, rendant difficile leur compréhension et leur comparaison. En raison de ce manque de compréhension, nous risquons de les utiliser inefficacement ou incorrectement, en particulier pour des modèles complexes comme CP, qui utilise deux vecteurs d'embedding basés sur le rôle, ou le modèle ComplEx à l'état de l'art, qui utilise des vecteurs d'embedding à valeurs complexes. Dans cet article, nous proposons un mécanisme d'interaction multi-embedding comme nouvelle approche pour unifier et généraliser ces modèles. Nous les dérivons théoriquement via ce mécanisme et fournissons des analyses empiriques et des comparaisons entre eux. Nous proposons également un nouveau modèle multi-embedding basé sur l'algèbre des quaternions et montrons qu'il obtient des résultats prometteurs en utilisant des benchmarks populaires. Le code source est disponible sur GitHub à l'adresse suivante : https://github.com/tranhungnghiep/AnalyzeKGE.