HyperAI
Command Palette
Search for a command to run...
WGO-Bench 是由 Macrodata_Labs 发布的机器人视频基准数据集,旨在评估视觉语言模型将机器人及第一人称操作视频转换为带时间戳的子任务标注的能力。该数据集主要面向边界检测与子任务标注两项任务,标注标签侧重于描述视频片段中可见的完整操作事件与状态变化。
数据集构成:
- 共包含 100 个视频片段(Episodes),涵盖 743 个黄金子任务片段(Segments)与 63 种独立任务指令
- 数据来源分为三类:HomER 第一人称视频(25 条)、 RoboInter DROID 机械臂视频(50 条)、 RoboCOIN Galaxea R1 Lite 头戴摄像头视频(25 条)
- 数据以 Parquet 格式存储,视频文件(MP4 字节)直接嵌入在每行数据中
数据字段:
- id: 稳定的视频片段唯一标识符
- video: 直接嵌入的 MP4 格式视频二进制数据
- instruction: 该片段对应的高层任务指令
- segments: 黄金标注列表,每个元素包含 start_sec(开始时间)、 end_sec(结束时间)与 subtask(子任务描述)。
- metadata: JSON 格式的源特定附加信息
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。