16 天前

RecallM:一种具备时序理解能力的可适配记忆机制,用于大语言模型

Brandon Kynoch, Hugo Latapie, Dwane van der Sluis
RecallM:一种具备时序理解能力的可适配记忆机制,用于大语言模型
摘要

大型语言模型(Large Language Models, LLMs)在人工智能领域取得了非凡进展,并在众多任务与应用领域展现出卓越的能力。然而,随着我们逐步迈向通用人工智能(Artificial General Intelligence, AGI)系统的构建,我们意识到必须为LLMs引入长期记忆机制,以突破上下文窗口的限制,更重要的是,为持续推理、累积学习以及长期用户交互奠定基础。本文提出了一种名为RecallM的新架构,旨在为LLMs提供一种可自适应调整且可动态更新的长期记忆能力。与以往方法不同,RecallM架构在信念更新以及对所提供知识的时间感知理解方面表现出显著优势。通过一系列实验,我们验证了该架构的有效性。此外,通过我们自主设计的时间感知与信念更新实验,结果表明,RecallM在更新长期记忆中存储的知识时,其效率是使用向量数据库的四倍。同时,我们还证明,RecallM在通用问答任务和上下文学习任务中也表现出具有竞争力的性能。