HyperAI超神经

VIRESET 视频实例编辑数据集

下载帮助

该数据集是由北京大学联合 OpenBayes 贝式计算于 2025 年发布的一个视频实例编辑数据集,相关论文成果为:「VIRES: Video Instance Repainting via Sketch and Text Guided Generation」,旨在为视频实例重绘、时序分割等任务提供精确的标注支撑。

该数据集包含:

  • SA-V 增强掩码标注,在原始 JSON 文件中新增 masklet_continues 字段,可通过 base64 解码和 pycocotools.mask 工具解析。
  • 86k 个视频片段,其中包含 85k 个训练视频和 1k 个评估视频,每段视频由 51 帧 24 FPS 、分辨率为 512×512 的图像组成,并附带结构草图序列和外观文本描述。

视频编辑示例