HyperAIHyperAI

Command Palette

Search for a command to run...

WGO-Bench 机器人视频基准数据集

日期

1 小时前

许可证

Non-Commercial

WGO-Bench 是由 Macrodata_Labs 发布的机器人视频基准数据集,旨在评估视觉语言模型将机器人及第一人称操作视频转换为带时间戳的子任务标注的能力。该数据集主要面向边界检测与子任务标注两项任务,标注标签侧重于描述视频片段中可见的完整操作事件与状态变化。

数据集构成:

  • 共包含 100 个视频片段(Episodes),涵盖 743 个黄金子任务片段(Segments)与 63 种独立任务指令
  • 数据来源分为三类:HomER 第一人称视频(25 条)、 RoboInter DROID 机械臂视频(50 条)、 RoboCOIN Galaxea R1 Lite 头戴摄像头视频(25 条)
  • 数据以 Parquet 格式存储,视频文件(MP4 字节)直接嵌入在每行数据中

数据字段:

  • id: 稳定的视频片段唯一标识符
  • video: 直接嵌入的 MP4 格式视频二进制数据
  • instruction: 该片段对应的高层任务指令
  • segments: 黄金标注列表,每个元素包含 start_sec(开始时间)、 end_sec(结束时间)与 subtask(子任务描述)。
  • metadata: JSON 格式的源特定附加信息

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供