HyperAIHyperAI
il y a 2 mois

Réseaux de neurones convolutionnels structuraux end-to-end pour le complétion de base de connaissances

Chao Shang; Yun Tang; Jing Huang; Jinbo Bi; Xiaodong He; Bowen Zhou
Réseaux de neurones convolutionnels structuraux end-to-end pour le complétion de base de connaissances
Résumé

L'embedding de graphes de connaissances a été un sujet de recherche actif pour le complétion des bases de connaissances, avec des améliorations progressives depuis les premiers modèles tels que TransE, TransH, DistMult et autres jusqu'aux modèles actuels comme ConvE. ConvE utilise une convolution 2D sur les embeddings et plusieurs couches de caractéristiques non linéaires pour modéliser les graphes de connaissances. Le modèle peut être formé efficacement et est adaptable aux grands graphes de connaissances. Cependant, il n'y a pas d'imposition de structure dans l'espace d'embedding de ConvE. Les réseaux de convolution graphique (GCN) récents offrent une autre méthode d'apprentissage des embeddings des nœuds du graphe en utilisant avec succès la structure de connectivité du graphe.Dans ce travail, nous proposons un nouveau réseau convolutionnel structuré end-to-end (SACN) qui combine les avantages des GCN et de ConvE. SACN comprend un encodeur basé sur un réseau de convolution graphique pondéré (WGCN) et un décodeur basé sur un réseau convolutionnel appelé Conv-TransE. Le WGCN utilise la structure nodale du graphe de connaissances, les attributs des nœuds et les types de relations entre les arêtes. Il dispose de poids apprenables qui ajustent la quantité d'information provenant des voisins utilisée dans l'agrégation locale, conduisant ainsi à des embeddings plus précis des nœuds du graphe. Les attributs des nœuds dans le graphe sont représentés sous forme de nœuds supplémentaires dans le WGCN.Le décodeur Conv-TransE permet au modèle state-of-the-art ConvE d'être translational entre entités et relations tout en conservant les mêmes performances de prédiction de liens que ConvE. Nous démontrons l'efficacité du SACN proposé sur les jeux de données standards FB15k-237 et WN18RR, où il offre une amélioration relative d'environ 10 % par rapport au state-of-the-art ConvE en termes de HITS@1, HITS@3 et HITS@10.