Refer-YouTube-VOS 是基于 Youtube-VOS 数据集建立的第一个视频分割数据集,即通过 video + caption 来执行分割。该数据集从视频中识别独特对象,每个目标对象被用两种方式进行了标注。
Refer-YouTube-VOS 视频分割数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 Refer-YouTube-VOS 视频分割数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 Refer-YouTube-VOS 视频分割数据集!

相关数据集推荐
How 2R 视频检索数据集
How 2R 是一个关于基于文本的视频检索数据集。数据集包含从 HowTo 100M 数据集的 9,371 个视频中收集了 24,328 个 60s 片段及其 51,390 个相关查询词,平均每个片段有 2-3 个相关查询词。其中 80% 的数据用于训练,10% 的数据用于验证,…

VALUE 视频语言理解评估数据集
VALUE 全称 Video-And-Language Understanding Evaluation,是一个关于视频和语言理解评估的数据集。该数据集是 11 个 VidL(视频和语言)数据集的集合,可用于3个常见任务:文本到视频检索;视频问题解答以及视频字幕。VALUE目标是…

AVSD 视听场景感知对话数据集
AVSD 全称 The Audio Visual Scene-Aware Dialog(或 DSTC7 Track 3)是一个用于理解对话的视听数据集。数据集旨在建立系统并对输入视频的对话框产生相应。
