HyperAI

QAngaroo 多步骤推理阅读理解数据集

日期

4 个月前

大小

324.1 MB

机构

QAngaroo 数据集是由伦敦大学学院 (UCL) 于 2018 年创建的专注于多跳(multi-hop,也称为多步骤)推理的阅读理解数据集,相关论文成果为「Constructing Datasets for Multi-hop Reading Comprehension Across Documents」。这个数据集包含两个部分:WikiHop 和 MedHop,旨在构建能够执行多跳推理的阅读理解方法,即在不同文档中分散的事实需要通过多个步骤的推理来得出新的事实。

WikiHop 是一个开放领域的数据集,专注于维基百科文章,包含训练集 43,738 个样本和验证集 5,129 个样本。

而 MedHop 则是基于 PubMed 论文摘要的数据集,包含训练集 1,620 个样本和验证集 342 个样本。

每个样本包含查询 (query) 、支持事实 (supports) 、候选答案 (candidates) 、正确答案 (answer) 和唯一标识符 (id) 这些数据集为研究者提供了训练和评估资源,以开发能够处理复杂推理任务的阅读理解模型。

QAngaroo.torrent
做种 1下载中 0已完成 21总下载 41
  • QAngaroo/
    • README.md
      1.72 KB
    • README.txt
      3.45 KB
      • data/
        • qangaroo_v1.1.zip
          324.1 MB