HyperAIHyperAI
il y a 17 jours

GRAIL : Apprendre à interagir avec de grands graphes de connaissances pour un raisonnement augmenté par la récupération

Ge Chang, Jinbo Su, Jiacheng Liu, Pengfei Yang, Yuhao Shang, Huiwen Zheng, et al
GRAIL : Apprendre à interagir avec de grands graphes de connaissances pour un raisonnement augmenté par la récupération
Résumé

Les modèles de langage à grande échelle (LLM) intégrant des techniques de génération augmentée par récupération (RAG) ont fait preuve d’une performance remarquable dans un large éventail de domaines. Toutefois, les approches RAG existantes fonctionnent principalement sur des données non structurées et montrent une capacité limitée à traiter des connaissances structurées telles que les graphes de connaissances. Par ailleurs, les méthodes actuelles de récupération de graphes peinent fondamentalement à capturer l’ensemble de la structure du graphe tout en faisant face à des difficultés de contrôle de précision, se traduisant par des lacunes critiques d’information ou des connexions redondantes excessives, ce qui nuit collectivement à la performance du raisonnement. Pour relever ce défi, nous proposons GRAIL : Graph-Retrieval Augmented Interactive Learning, un cadre conçu pour interagir avec des graphes à grande échelle afin de réaliser un raisonnement augmenté par la récupération. Plus précisément, GRAIL intègre une exploration aléatoire guidée par un LLM avec un filtrage de chemins afin d’établir une chaîne de synthèse de données, où une trajectoire de raisonnement fine est automatiquement générée pour chaque tâche. Sur la base des données synthétisées, nous mettons ensuite en œuvre un processus d’entraînement en deux étapes afin d’apprendre une politique capable de décider dynamiquement des actions optimales à chaque étape du raisonnement. L’objectif global d’équilibre entre précision et concision dans la récupération de graphes est décomposé en récompenses supervisées par processus fin, afin d’améliorer l’efficacité des données et la stabilité de l’entraînement. En phase de déploiement pratique, GRAIL adopte un paradigme interactif de récupération, permettant au modèle d’explorer de manière autonome les chemins du graphe tout en équilibrant dynamiquement l’étendue et la précision de la récupération. Des expériences étendues montrent que GRAIL atteint une amélioration moyenne de 21,01 % en précision et une amélioration de 22,43 % en F1 sur trois jeux de données de questions-réponses sur des graphes de connaissances. Le code source et les jeux de données sont disponibles à l’adresse suivante : [lien URL].