HyperAIHyperAI

Command Palette

Search for a command to run...

RoVid-X 机器人视频生成数据集

在 Discord 上讨论

日期

4 小时前

数据集组织

Peking University
字节跳动 Seed

论文 URL

2601.15282

许可证

CC BY 4.0

RoVid-X 是由北京大学联合 ByteDance Seed 于 2026 年发布的机器人视频生成数据集,相关论文成果为 Rethinking Video Generation Model for the Embodied World,旨在解决视频生成模型在生成机器人视频时面临的物理挑战。

该数据集包含约 4,000,000 段机器人的视频片段,总时长超过 10,000 小时,涵盖 1,300 多种细粒度的机器人技能。视频提供了多模态的物理标注,包括 RGB 、深度和光流信息,支持多机器人和多任务的多样性,覆盖不同的机器人类型、场景和动作技能。

数据集构成:

  • 4,000,000 段机器人的视频片段
  • 多模态物理标注(RGB 、深度、光流)
  • 1300 多种细粒度机器人技能

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供