Command Palette

Search for a command to run...

M3-Bench 长视频问答基准数据集

日期

3 个月前

机构

字节跳动 Seed

论文链接

2508.09736

许可协议

非商业用途

标签

M3-Bench 是由字节跳动 Seed 团队于 2025 年发布的一个长视频问答基准数据集,相关论文成果为「Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory」,旨在评测多模态智能体长时程记忆与推理能力。

该数据集包含 1,020 段视频样本,每段样本包含字幕、中间产物、记忆图。 M3-Bench 以长视频开放式问答(VQA)为核心任务,每段视频配有一组开放式问题。

数据组成:

  • M3-Bench-robot:研究团队新录制的 100 段真实场景第一视角视频(机器人视角)
  • M3-Bench-web:920 段来自网络、覆盖更广内容与场景的长视频

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供