StarGraph : Apprentissage de la représentation des connaissances basé sur des sous-graphes à deux sauts incomplets

Les algorithmes de apprentissage de représentation conventionnels pour les graphes de connaissances (GC) associent à chaque entité un vecteur d'embedding unique, ignorant ainsi les informations riches contenues dans le voisinage. Nous proposons une méthode nommée StarGraph, qui offre une nouvelle approche pour exploiter les informations de voisinage dans des graphes de connaissances à grande échelle afin d'obtenir des représentations d'entités. Tout d'abord, un sous-graphe de voisinage incomplet à deux sauts est généré pour chaque nœud cible, puis traité par un réseau d'auto-attention modifié pour obtenir la représentation d'entité, qui remplace l'embedding d'entité utilisé dans les méthodes traditionnelles. Nous avons obtenu des performances SOTA (State Of The Art) sur ogbl-wikikg2 et des résultats compétitifs sur fb15k-237. Les résultats expérimentaux démontrent que StarGraph est efficace en termes de paramètres, et l'amélioration réalisée sur ogbl-wikikg2 atteste de son excellente efficacité dans l'apprentissage de représentation sur des graphes de connaissances à grande échelle. Le code est désormais disponible à l'adresse \url{https://github.com/hzli-ucas/StarGraph}.