Alignement d'entités pour les graphes de connaissances à l'aide de réseaux de convolution multi-ordre
Les graphes de connaissances (KG) sont devenus des structures populaires pour unifier les entités du monde réel en modélisant les relations entre elles ainsi que leurs attributs. L’alignement d’entités — tâche consistant à identifier les entités correspondantes entre différents KG — a suscité un intérêt croissant tant dans le milieu académique que dans l’industrie. Toutefois, les techniques d’alignement existantes exigent souvent de grandes quantités de données étiquetées, ne parviennent pas à encoder simultanément des données multimodales, et imposent uniquement peu de contraintes de cohérence. Dans cet article, nous proposons un cadre d’alignement d’entités entièrement end-to-end et non supervisé pour les graphes de connaissances multilingues, qui intègre divers types d’informations afin d’exploiter pleinement la richesse des données des KG. Le modèle capture les corrélations basées sur les relations entre entités grâce à un modèle de réseau de convolution graphique (GCN) à plusieurs ordres conçu pour respecter les contraintes de cohérence, tout en intégrant les corrélations basées sur les attributs via une machine de translation. Nous adoptons un mécanisme de fusion tardive pour combiner l’ensemble des informations, permettant ainsi à ces approches de se compléter mutuellement et améliorant ainsi le résultat final de l’alignement, tout en rendant le modèle plus robuste aux violations de cohérence. Les résultats expérimentaux montrent que notre modèle est non seulement plus précis que les méthodes de référence, mais aussi plusieurs ordres de grandeur plus rapide. Nous démontrons également sa sensibilité aux hyperparamètres, l’économie de l’effort d’étiquetage et sa robustesse face à des conditions adverses.