日期
机构
发布地址
github.com
许可协议
其他
标签
视频字幕
视频检索
问答数据集
分类
How 2R 是一个关于基于文本的视频检索数据集。数据集包含从 HowTo 100M 数据集的 9,371 个视频中收集了 24,328 个 60s 片段及其 51,390 个相关查询词,平均每个片段有 2-3 个相关查询词。其中 80% 的数据用于训练,10% 的数据用于验证,10% 的数据用于测试。
How 2R 和 How 2QA 是新的具有挑战性的 benchmarks,可用于研究视频检索和视频问答领域。