17 天前
GRAIL:用于检索增强推理的大型知识图谱交互学习
Ge Chang, Jinbo Su, Jiacheng Liu, Pengfei Yang, Yuhao Shang, Huiwen Zheng, et al

摘要
将大型语言模型(LLMs)与检索增强生成(RAG)技术相结合,已在多个领域展现出卓越的性能。然而,现有的RAG方法主要针对非结构化数据,对于知识图谱等结构化知识的处理能力有限。与此同时,当前的图谱检索方法在捕捉整体图结构方面存在根本性困难,同时面临精度控制难题,表现为关键信息缺失或冗余连接过多,这些问题共同削弱了模型的推理能力。 为应对这一挑战,我们提出GRAIL:图谱检索增强的交互式学习框架(Graph-Retrieval Augmented Interactive Learning),该框架旨在与大规模图谱进行交互,实现检索增强型推理。具体而言,GRAIL结合了LLM引导的随机探索与路径过滤机制,构建了一条数据合成流水线,能够为每个任务自动生成细粒度的推理轨迹。基于合成数据,我们进一步采用两阶段训练策略,学习一个策略模型,以动态决定每个推理步骤中的最优操作。我们将图谱检索中精度与简洁性之间的整体优化目标,分解为细粒度的过程监督奖励,从而提升数据利用效率与训练稳定性。 在实际部署中,GRAIL采用交互式检索范式,使模型能够自主探索图谱路径,同时动态平衡检索的广度与精度。大量实验结果表明,GRAIL在三个知识图谱问答数据集上,平均准确率提升了21.01%,F1值提升了22.43%。我们的源代码与数据集已公开,获取地址见此链接:[https URL]。