VQA-HAT 智能问答数据集

数据集下载 磁力链 下载帮助

VQA-HAT 又称 VQA Human Attention,能根据所询问的问题评估图像的信息区域。康奈尔大学的团队通过让志愿者回答锐化模糊图像的区域,来获得人类视觉注意力图。

该数据集由原始 VQA 数据集中图像上的人类视觉注意力图组成。它包含超过 60k 张的人类视觉注意力图。

1 做种 0 下载 93 已完成
  • VQA-HAT/README.md 1.08 KB
  • VQA-HAT/README.txt 1.08 KB
  • VQA-HAT/data/vqahat_train.zip 702.38 MB
  • VQA-HAT/data/vqahat_val.zip 47 MB