HyperAI超神经

DVQA 图像问答数据集

日期

1 年前

大小

5.42 GB

机构

发布地址

kushalkafle.com

特色图像

该数据集是 Rochester Institute of Technology 和 Adobe Research 的研究论文 DVQA: Understanding Data Visualizations via Question Answering 中提出的数据集。数据集包含三个文件夹:图像文件夹、问题答案对文件夹和条形图元数据文件夹。

条形图是传达数字信息的有效方式,但当今的算法无法解析它们。当面临即使是微小的外观变化时,现有方法也会失败。研究团队提出了 DVQA,这是一个在问答框架中测试条形图理解的许多方面的数据集。与视觉问答 (VQA) 不同,DVQA 需要处理特定条形图特有的单词和答案。最先进的 VQA 算法在 DVQA 上表现不佳,研究团队提出了两个表现更好的强大基线。研究团队的工作将使算法能够从科学出版物、互联网文章、商业报告和许多其他领域中的大量条形图中自动提取数字和语义信息。

DVQA 数据集是用 matplotlib 生成的,数据集有两种题型:一种是对于每个图表通用的一般疑问句,一种是对特定图表有效的特殊疑问句。

问题涵盖了三个方面:a) 结构理解、 b) 数据检索、 c) 数据推理。例子见上图。
测试集有两种问题涵盖单词范围:Test-Familiar 只包括训练集中有的单词、 Test-Novel 还包含新出现的单词。

DVQA.torrent
做种 1正在下载 1已完成 95总下载次数 70
  • DVQA/
    • README.md
      2.05 KB
    • README.txt
      4.1 KB
      • data/
        • dvqa dataset.zip
          5.42 GB