HyperAI
Command Palette
Search for a command to run...
RoVid-X 机器人视频生成数据集
RoVid-X 是由北京大学联合 ByteDance Seed 于 2026 年发布的机器人视频生成数据集,相关论文成果为 Rethinking Video Generation Model for the Embodied World,旨在解决视频生成模型在生成机器人视频时面临的物理挑战。
该数据集包含约 4,000,000 段机器人的视频片段,总时长超过 10,000 小时,涵盖 1,300 多种细粒度的机器人技能。视频提供了多模态的物理标注,包括 RGB 、深度和光流信息,支持多机器人和多任务的多样性,覆盖不同的机器人类型、场景和动作技能。
数据集构成:
- 4,000,000 段机器人的视频片段
- 多模态物理标注(RGB 、深度、光流)
- 1300 多种细粒度机器人技能
该数据集由社区用户贡献,仅供交流学习使用。如内容涉及侵权,请联系邮箱 [email protected] 以便及时审查和下架。