Complétion de graphe de connaissances multilingue par transfert d'ensemble de connaissances

La prédiction des faits manquants dans un graphe de connaissances (KG) constitue une tâche cruciale dans la construction et le raisonnement sur les bases de connaissances, et elle fait l’objet de nombreuses recherches récentes basées sur les embeddings de KG. Bien que les approches existantes d’embeddings de KG se concentrent principalement sur l’apprentissage et la prédiction des faits au sein d’un seul KG, une solution plus réaliste bénéficierait des connaissances présentes dans plusieurs KG spécifiques à des langues différentes, compte tenu du fait que ces derniers présentent chacun des forces et des limites propres en termes de qualité et de couverture des données. Ce défi est toutefois considérable, car le transfert de connaissances entre plusieurs KG indépendamment maintenus est souvent entravé par un manque d’informations d’alignement et par des incohérences entre les faits décrits. Dans cet article, nous proposons KEnS, un cadre novateur pour l’apprentissage d’embeddings et le transfert d’ensemble de connaissances à travers plusieurs KG spécifiques à des langues. KEnS projette tous les KG dans un espace d’embedding partagé, où les associations entre entités sont capturées grâce à un apprentissage auto-supervisé. Ensuite, KEnS effectue une inférence par ensemble afin de combiner les résultats de prédiction provenant des embeddings de plusieurs KG linguistiques, en explorant différentes techniques d’agrégation. Des expériences menées sur cinq KG réels spécifiques à des langues montrent que KEnS améliore de manière cohérente les méthodes de pointe en matière de complétion de KG, en identifiant efficacement et en exploitant les connaissances complémentaires.