Complétion de graphe de connaissances multilingue avec alignement adaptatif auto-supervisé du graphe

La prédiction des faits manquants dans un graphe de connaissances (KG) est essentielle, car les KG modernes sont loin d’être complets. En raison du marquage humain coûteux en temps, ce phénomène s’aggrave lorsqu’il s’agit de traiter des connaissances représentées dans différentes langues. Dans cet article, nous explorons la complétion multilingue des KG, qui exploite un alignement initial limité comme un pont pour intégrer les connaissances collectives issues de plusieurs langues. Toutefois, l’alignement linguistique utilisé dans les travaux antérieurs n’est pas pleinement exploité : (1) les paires d’alignement sont traitées de manière équivalente afin de rapprocher au maximum les entités parallèles, ce qui ignore l’incohérence de la capacité des KG ; (2) l’alignement initial est rare, et l’identification de nouveaux alignements s’effectue généralement de manière bruyante et non supervisée. Pour relever ces défis, nous proposons une nouvelle méthode auto-supervisée d’alignement adaptatif de graphes (SS-AGA). Plus précisément, SS-AGA fusionne tous les KG en un seul graphe en considérant l’alignement comme un nouveau type d’arête. Ainsi, la propagation d’information et l’influence du bruit entre les KG peuvent être contrôlées de manière adaptative grâce à des poids d’attention sensibles aux relations. Par ailleurs, SS-AGA intègre un nouveau générateur de paires qui capture dynamiquement des paires d’alignement potentielles dans un cadre auto-supervisé. Des expériences étendues sur le KG multilingue public DBPedia ainsi que sur un nouveau KG industriel multilingue issu du commerce électronique démontrent empiriquement l’efficacité de SS-AGA.