Interaction d’embedding à partitions multiples avec une formulation de terme bloc pour la complétion de graphes de connaissances

La complétion des graphes de connaissances est une tâche cruciale visant à prédire les liens relationnels manquants entre des entités. Les méthodes d’embedding des graphes de connaissances accomplissent cette tâche en représentant les entités et les relations sous forme de vecteurs d’embedding, puis en modélisant leurs interactions pour calculer le score de correspondance de chaque triplet. Les travaux antérieurs ont généralement traité chaque embedding comme un tout, en modélisant les interactions entre ces embeddings globaux, ce qui peut entraîner un coût computationnel élevé ou nécessiter des mécanismes d’interaction spécialement conçus. Dans ce travail, nous proposons le modèle d’interaction d’embedding à partitions multiples (MEI) basé sur la forme tensorielle par blocs, afin d’aborder systématiquement ce problème. MEI divise chaque embedding en un vecteur à partitions multiples, permettant ainsi de restreindre efficacement les interactions. Chaque interaction locale est modélisée à l’aide de la forme tensorielle de Tucker, tandis que l’interaction complète est modélisée via la forme tensorielle par blocs, ce qui permet à MEI de contrôler le compromis entre expressivité et coût computationnel, d’apprendre automatiquement les mécanismes d’interaction à partir des données, et d’atteindre des performances de pointe sur la tâche de prédiction de liens. En outre, nous étudions théoriquement le problème d’efficacité des paramètres et dérivons un critère simple, vérifié empiriquement, pour un compromis optimal en termes de paramètres. Nous appliquons également le cadre MEI pour offrir une nouvelle explication généralisée de plusieurs mécanismes d’interaction spécifiquement conçus dans des modèles antérieurs. Le code source est disponible à l’adresse suivante : https://github.com/tranhungnghiep/MEI-KGE.