HyperAIHyperAI

Command Palette

Search for a command to run...

MIA 多步推理与决策轨迹数据集

日期

21 小时前

数据集组织

论文 URL

2604.04503

许可证

MIT

MIA 是由华东师范大学、上海创新研究院和哈尔滨工业大学于 2026 年 4 月联合发布的一个用于训练和评估具备长期记忆与任务执行能力的智能体的数据集,相关论文成果为 Memory Intelligence Agent,旨在提升智能体的长期记忆利用与多步决策能力。 该数据集包含约 2.1 万条推理轨迹数据,涵盖问题、规划、搜索与执行全过程,适用于 Agent 推理与强化学习研究。

数据结构

该数据集包含以下组成部分:

  • 训练:用于执行器和规划器的两阶段强化学习 (RL) 训练的数据
  • 测试:跨多个数据集(例如 LiveVQA 、 HotpotQA)评估基准,以衡量研究和推理性能
  • TTRL:专门为持续测试时学习而精心挑选的数据,使规划器能够在推理过程中调整其策略
  • 图像搜索缓存:支持图像到图像搜索任务的缓存

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MIA 多步推理与决策轨迹数据集 | 数据集 | HyperAI超神经