HyperAI
Command Palette
Search for a command to run...
MIA 多步推理与决策轨迹数据集
MIA 是由华东师范大学、上海创新研究院和哈尔滨工业大学于 2026 年 4 月联合发布的一个用于训练和评估具备长期记忆与任务执行能力的智能体的数据集,相关论文成果为 Memory Intelligence Agent,旨在提升智能体的长期记忆利用与多步决策能力。 该数据集包含约 2.1 万条推理轨迹数据,涵盖问题、规划、搜索与执行全过程,适用于 Agent 推理与强化学习研究。
数据结构
该数据集包含以下组成部分:
- 训练:用于执行器和规划器的两阶段强化学习 (RL) 训练的数据
- 测试:跨多个数据集(例如 LiveVQA 、 HotpotQA)评估基准,以衡量研究和推理性能
- TTRL:专门为持续测试时学习而精心挑选的数据,使规划器能够在推理过程中调整其策略
- 图像搜索缓存:支持图像到图像搜索任务的缓存
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。