Apprentissage conjoint des représentations d'entités et de relations pour l'alignement d'entités

L’alignement d’entités constitue un moyen efficace pour intégrer des connaissances hétérogènes entre différents graphes de connaissances (KG). Les avancées récentes dans ce domaine adoptent souvent une approche fondée sur les embeddings afin de modéliser les informations structurelles des KG, permettant ainsi d’effectuer l’alignement d’entités de manière aisée dans l’espace d’embeddings. Toutefois, la plupart des travaux existants ne tirent pas explicitement parti des représentations utiles des relations pour faciliter l’alignement d’entités — une approche que nous démontrons dans cet article être simple tout en étant particulièrement efficace pour améliorer la précision de l’alignement. Ce papier présente un nouveau cadre d’apprentissage conjoint pour l’alignement d’entités. Au cœur de notre méthode se trouve un cadre basé sur les réseaux de convolution de graphe (GCN) permettant d’apprendre simultanément les représentations d’entités et de relations. Contrairement aux approches existantes qui s’appuient sur des graines d’alignement de relations prédéfinies pour apprendre les représentations des relations, nous approximons d’abord ces dernières à partir des embeddings d’entités appris par le GCN. Nous intégrons ensuite cette approximation des relations aux entités afin d’itérativement améliorer les représentations de celles-ci ainsi que celles des relations. Des expérimentations menées sur trois jeux de données réels multilingues montrent que notre approche surpasse significativement les méthodes d’alignement d’entités de pointe.