Apprentissage par ensemble sensible aux relations pour l’intégration de graphes de connaissances

L’embedding des graphes de connaissances (KG) constitue une tâche fondamentale en traitement du langage naturel, et diverses méthodes ont été proposées pour explorer les motifs sémantiques de manières distinctes. Dans cet article, nous proposons d’apprendre un ensemble en exploitant de manière consciente aux relations des méthodes existantes. Toutefois, l’exploration de ces sémantiques à l’aide d’un ensemble conscient aux relations conduit à un espace de recherche bien plus vaste que les méthodes d’ensemble classiques. Pour résoudre ce problème, nous introduisons un algorithme de division-recherche-combinaison, appelé RelEns-DSC, qui recherche indépendamment les poids d’ensemble par relation. Cet algorithme présente un coût computationnel identique à celui des méthodes d’ensemble générales, tout en offrant des performances nettement supérieures. Les résultats expérimentaux sur des jeux de données standard démontrent l’efficacité de la méthode proposée pour rechercher de manière efficace les poids d’ensemble conscients aux relations et atteindre des performances de state-of-the-art en embedding. Le code source est disponible à l’adresse suivante : https://github.com/LARS-research/RelEns.