HyperAIHyperAI

Command Palette

Search for a command to run...

M3-Bench 长视频问答基准数据集

Use this DatasetDiscuss on Discord

Date

5 个月前

Organization

字节跳动 Seed

Paper URL

2508.09736

License

Non-Commercial

M3-Bench 是由字节跳动 Seed 团队于 2025 年发布的一个长视频问答基准数据集,相关论文成果为「Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory」,旨在评测多模态智能体长时程记忆与推理能力。

该数据集包含 1,020 段视频样本,每段样本包含字幕、中间产物、记忆图。 M3-Bench 以长视频开放式问答(VQA)为核心任务,每段视频配有一组开放式问题。

数据组成:

  • M3-Bench-robot:研究团队新录制的 100 段真实场景第一视角视频(机器人视角)
  • M3-Bench-web:920 段来自网络、覆盖更广内容与场景的长视频

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供