
摘要
在本研究中,我们致力于解决大型语言模型(LLMs)在时间知识推理方面面临的挑战。LLMs 在该任务中常表现出不足,导致生成不准确或具有误导性的回答。这一问题主要源于其在处理动态演变的事实知识以及复杂时间逻辑方面的能力有限。为克服上述局限,我们提出了一种名为抽象推理诱导(Abstract Reasoning Induction, ARI)的框架。该框架将时间推理过程划分为两个独立阶段:无知识依赖阶段与基于知识阶段。ARI 在为 LLM 提供事实知识支持的同时,有效减少了外部噪声数据的引入。同时,基于建构主义理念,ARI 使 LLM 能够从正确与错误的历史推理样本中主动开展自我导向的学习。通过引导 LLM 主动构建知识与推理方法,显著提升了其时间推理能力。实验结果表明,该方法在两个时间问答(temporal QA)数据集上分别实现了 29.7% 和 9.27% 的相对性能提升,充分验证了其在增强 LLM 时间推理能力方面的有效性。相关代码已开源,地址为:https://github.com/czy1999/ARI-QA。