VQA (v2.0) 开放式问答数据集
VQA (v2.0) 全称 Visual Question Answering (v2.0),是一个人工标注的、关于图像的开放式问答数据集。回答这些问题,需要对图像、语言以及常识都具备一定的理解力。
示例图像:

该数据集包括:
- 265,016 张图像(源自 COCO 以及 abstract scenes 数据集)
- 每幅图像涉及到的问题数量大于等于 3(平均 5.4 个问题)
- 每个问题包含 10 个基准真相 (ground truth)
- 每个问题包含 3 个合理(但不一定正确)的答案
- 自动评估指标
VQA 数据集首发于 2015 年 10 月,2017 年 4 月发布 VQA v2.0 。该数据集为 v2.0 版本,相比于 VQA v1.0,v2.0 为每个问题补充了图片,以尽量减少语言偏见。
Visual_Question_Answering_(VQA).torrent
做种 1正在下载 1已完成 570总下载次数 1,326