The Children’s Book Test 问答数据集

CBT 数据集由文字段落和相应问题构建,问答数据均来自古腾堡项目免费提供的书籍,该数据集用于直接测量语言模型、更广泛的语言环境用于问答和仿真查找。 CBT 数据集由 Facebook 于 2016 年发布,主要发布人有 Felix Hill、Antoine Bordes、Sumi…

bAbi 问答和文本理解的数据集

The QA bAbI tasks 是 bAbI 项目中的用于问答和文本理解的训练数据集,其被用于测试文本理解和推理中第一组的 20 个任务,每项任务中均有 1000 个问题用于培训、1000 个问题用于测试。 该数据集由一组上下文组成,基于上下文可以使用多个问答对,目前有以下几…

Question Answer Dataset v1.2 问答数据集

Question Answer Dataset 是结合维基百科文章语料库的链接,并手动生成仿真问题和答案以供学术研究的问答数据集。该数据集分为文章、问题和答案三部分,其中手动生成的仿真问题与答案对维基百科文章的评分难度很高。 Question Answer Dataset 由卡内…