VCR 视觉常识推理数据集

数据集下载 磁力链 下载帮助

VCR 全称 Visual Commonsense Reasoning,是一个用于视觉常识推理的大规模数据集。该数据集提出了关于图像的具有挑战性的问题,机器需要完成两个子任务:正确回答问题以及提供理由证明其答案的合理性。

VCR 数据集包含大量问题,其中 212K 个用于训练,26K 个用于验证,25K 个用于测试。答案和理由来自超过 110K 个不重复的电影场景。

2 做种 0 下载 24 已完成
  • VCR/README.md 1.17 KB
  • VCR/README.txt 1.17 KB
  • VCR/data/vcr1annots.zip 92.5 MB
  • VCR/data/vcr1images.zip 27.46 GB