
HotpotQA 数据集是一个在英文维基百科上收集的大规模问答数据集,包括 11.3 万个众包问题,要回答这些问题,需要参照两篇维基百科文章的介绍段落。每个问题都包含两个黄金段落 (gold paragraph) 以及部分段落中的句子列表,这些句子列表中提供的支持性事实,被认定为是回答问题所必需的。
该数据集具有以下特征:
- 问题需要在多个支持文档中查找和推理才能回答;
- 问题是多样化的,不受任何预先存在的知识库或知识模式的限制;
- 该数据集提供推理所需的句子级支持事实,让 QA 系统在强监督下进行推理并解释预测;
- 该数据集提供了一种新型的事实比较问题来测试 QA 系统提取相关事实并进行必要比较的能力。
HotpotQA.torrent
做种 1正在下载 1已完成 409总下载次数 791