HyperAIHyperAI
il y a 3 mois

Utilisation des informations d'occurrence appariée pour améliorer la complétion des graphes de connaissances sur des ensembles de données à grande échelle

Esma Balkir, Masha Naslidnyk, Dave Palfrey, Arpit Mittal
Utilisation des informations d'occurrence appariée pour améliorer la complétion des graphes de connaissances sur des ensembles de données à grande échelle
Résumé

Les modèles bilinéaires tels que DistMult et ComplEx constituent des méthodes efficaces pour la complétion des graphes de connaissances (KG). Toutefois, ils nécessitent des tailles de batch importantes, ce qui constitue un goulot d’étranglement en termes de performance lors de l’entraînement sur des jeux de données à grande échelle, en raison de contraintes mémoire. Dans cet article, nous utilisons les occurrences des paires entité-relations dans le jeu de données pour construire un modèle d’apprentissage conjoint et améliorer la qualité des exemples négatifs échantillonnés pendant l’entraînement. Nous démontrons, sur trois jeux de données standards, qu’en combinant ces deux techniques, on obtient une amélioration significative des performances, en particulier lorsque la taille du batch et le nombre d’exemples négatifs générés sont faibles par rapport à la taille du jeu de données. Nous appliquons ensuite nos méthodes à un jeu de données comprenant 2 millions d’entités, et montrons que notre modèle surpasse la méthode de référence de 2,8 points absolus en termes de hits@1.