How 2R 视频检索数据集

日期

1 年前

机构

Microsoft Dynamics 365 AI Research

发布地址

github.com

许可协议

其他

下载帮助
特色图像

How 2R 是一个关于基于文本的视频检索数据集。数据集包含从 HowTo 100M 数据集的 9,371 个视频中收集了 24,328 个 60s 片段及其 51,390 个相关查询词,平均每个片段有 2-3 个相关查询词。其中 80% 的数据用于训练,10% 的数据用于验证,10% 的数据用于测试。

How 2R 和 How 2QA 是新的具有挑战性的 benchmarks,可用于研究视频检索和视频问答领域。