Embedding Parallèle Efficace pour les Graphes de Connaissances

L'embedding de graphes de connaissances vise à plonger les entités et les relations des graphes de connaissances dans des espaces vectoriels de faible dimension. Les méthodes d'embedding par traduction considèrent les relations comme une traduction des entités de tête vers les entités de queue, ce qui leur permet d'obtenir des résultats parmi les meilleurs dans le domaine de l'embedding de graphes de connaissances. Cependant, une limitation majeure de ces méthodes est le processus d'entraînement très coûteux en temps, qui peut prendre plusieurs jours voire plusieurs semaines pour des graphes de connaissances volumineux, rendant leur utilisation pratique très difficile. Dans cet article, nous proposons un cadre parallèle efficace pour les méthodes d'embedding par traduction, appelé ParTrans-X, qui permet d'exécuter ces méthodes en parallèle sans verrous en exploitant les structures distinctives des graphes de connaissances. Des expériences menées sur deux jeux de données avec trois méthodes d'embedding par traduction typiques, à savoir TransE [3], TransH [17] et une variante plus efficace TransE-AdaGrad [10], ont validé que ParTrans-X peut accélérer le processus d'entraînement d'un facteur supérieur à 10.