HyperAIHyperAI
il y a 11 jours

Alignement d'entités non supervisé pour les graphes de connaissances temporels

Xiaoze Liu, Junyang Wu, Tianyi Li, Lu Chen, Yunjun Gao
Alignement d'entités non supervisé pour les graphes de connaissances temporels
Résumé

L’alignement d’entités (EA) est une tâche fondamentale d’intégration de données qui consiste à identifier des entités équivalentes entre différents graphes de connaissances (KG). Les graphes de connaissances temporels (TKG) étendent les graphes de connaissances traditionnels en introduisant des horodatages, un aspect qui suscite un intérêt croissant. Les recherches les plus récentes sur l’EA sensible au temps ont montré que l’information temporelle des TKG améliore significativement les performances de l’EA. Toutefois, les études existantes n’ont pas pleinement exploité les avantages offerts par cette information temporelle. De plus, elles procèdent à l’alignement des entités en pré-alignant des paires d’entités, une démarche souvent fastidieuse et donc inefficace.Dans cet article, nous proposons DualMatch, une méthode qui intègre efficacement les informations relationnelles et temporelles pour l’EA. DualMatch reformule l’EA sur les TKG comme un problème d’appariement de graphes pondérés. Plus précisément, DualMatch intègre une méthode non supervisée permettant d’effectuer l’EA sans nécessiter d’alignements initiaux (seed alignment). La méthode se déroule en deux étapes : (i) encoder séparément les informations temporelles et relationnelles sous forme d’embeddings à l’aide d’un nouvel encodeur sans étiquetage, nommé Dual-Encoder ; (ii) fusionner ces deux types d’informations et les transformer en alignements grâce à un nouveau décodeur basé sur l’appariement de graphes, appelé GM-Decoder. Grâce à sa capacité à capturer efficacement les informations temporelles, DualMatch peut réaliser l’EA sur des TKG, qu’il s’agisse de scénarios supervisés ou non supervisés. Des expérimentations étendues sur trois jeux de données réels de TKG montrent que DualMatch surpasser les méthodes de pointe en termes d’H@1 de 2,4 % à 10,7 % et en termes de MRR de 1,7 % à 7,6 %.

Alignement d'entités non supervisé pour les graphes de connaissances temporels | Articles de recherche récents | HyperAI