VQA 全称 Visual question answering,HowToVQA69M 是一个视频问答数据集,共包含 69,270,581 个问答,其规模比现有视频问答数据集 VideoQA 大两倍。
平均每个原始视频会产生 43 个视频片段,每个片段 12.1 秒并与 1.2 个问答相关联,问题包含 8.7 个单词,答案包含 2.4 个单词。HowToVQA69M 数据集高度多样化,包含超过 1600 万个唯一答案,其中超过 200 万个唯一答案出现一次以上,超过 30 万个唯一答案出现 10 次以上。
1 做种
0 下载
203 已完成
- HowToVQA69M/README.md 1.23 KB
- HowToVQA69M/README.txt 1.23 KB
- HowToVQA69M/data/ReadMe.txt 935 B
- HowToVQA69M/data/howtovqa.pkl 5.98 GB
- HowToVQA69M/data/train_howtovqa.csv 33.8 MB
- HowToVQA69M/data/val_howtovqa.csv 3.76 MB
- HowToVQA69M/data/vedio/HowTo100M.zip 1.86 GB