强化学习框架 Mem-𝛼
Mem-𝛼 是由 Anuttacon 、加利福尼亚大学圣迭戈分校联合斯坦福大学研究团队于 2025 年 9 月提出的,相关研究成果发表于论文 Mem-α: Learning Memory Construction via Reinforcement Learning 。
Mem-𝛼 是一个通过交互和反馈训练代理有效管理复杂记忆系统的强化学习框架,与现有方法不同,该框架使智能体能够学习用于复杂、多组件记忆架构的记忆构建策略。首先,研究人员将记忆构建过程表述为一个序列决策问题,其中智能体处理信息块,决定执行哪些记忆操作,并根据整个交互历史中的下游问答准确度获得多个奖励。其次构建了一个涵盖多种多轮交互模式的专门训练数据集,包括对话、文档共享、模式识别和故事讲述,并配以需要全面记忆才能正确回答的综合评估问题。