HyperAI超神经
16 days ago

MIRIX:基于LLM的多智能体记忆系统

Yu Wang, Xi Chen
MIRIX:基于LLM的多智能体记忆系统
摘要

尽管人工智能代理的记忆能力正受到越来越多的关注,现有的解决方案仍然存在根本性的局限。大多数依赖于扁平且范围狭窄的记忆组件,限制了它们在长时间内个性化、抽象化和可靠回忆用户特定信息的能力。为此,我们引入了MIRIX,这是一种模块化的多代理记忆系统,通过解决该领域最紧迫的挑战——使语言模型真正具备记忆功能——重新定义了AI记忆的未来。与以往的方法不同,MIRIX不仅超越了文本,还涵盖了丰富的视觉和多模态体验,使记忆在现实世界场景中真正有用。MIRIX由六种不同的、精心设计的记忆类型组成:核心记忆(Core)、情景记忆(Episodic)、语义记忆(Semantic)、程序性记忆(Procedural)、资源记忆(Resource Memory)和知识库(Knowledge Vault),并结合一个多代理框架,动态控制和协调更新及检索过程。这一设计使得代理能够在大规模上持久存储、推理和准确检索多样化的长期用户数据。我们在两个具有挑战性的环境中验证了MIRIX的有效性。首先,在ScreenshotVQA基准测试中,该测试包含每序列近20,000张高分辨率计算机屏幕截图,需要深刻的情境理解能力,并且目前没有任何现有的记忆系统能够应用于此场景。MIRIX在此基准上比RAG基线提高了35%的准确性,同时将存储需求减少了99.9%。其次,在LOCOMO长篇对话基准测试中,该测试以单模态文本输入为主,MIRIX达到了85.4%的最先进性能,远超现有基线水平。这些结果表明,MIRIX为增强记忆功能的语言模型代理设定了新的性能标准。为了使用户能够体验我们的记忆系统,我们提供了一个由MIRIX驱动的应用程序包。该应用程序实时监控屏幕,构建个性化的记忆库,并提供直观的可视化界面和安全的本地存储以确保隐私保护。