VQA-HAT 又称 VQA Human Attention,能根据所询问的问题评估图像的信息区域。康奈尔大学的团队通过让志愿者回答锐化模糊图像的区域,来获得人类视觉注意力图。
该数据集由原始 VQA 数据集中图像上的人类视觉注意力图组成。它包含超过 60k 张的人类视觉注意力图。
1 做种
0 下载
93 已完成
- VQA-HAT/README.md 1.08 KB
- VQA-HAT/README.txt 1.08 KB
- VQA-HAT/data/vqahat_train.zip 702.38 MB
- VQA-HAT/data/vqahat_val.zip 47 MB