CBT 数据集由文字段落和相应问题构建,问答数据均来自古腾堡项目免费提供的书籍,该数据集用于直接测量语言模型、更广泛的语言环境用于问答和仿真查找。
CBT 数据集由 Facebook 于 2016 年发布,主要发布人有 Felix Hill、Antoine Bordes、Sumit Chopra 和 Jason Weston,相关论文有《The Goldilocks Principle: Reading Children’s Books with Explicit Memory Representations》。
3 做种
0 下载
985 已完成
- The Children's Book Test/README.md 1.17 KB
- The Children's Book Test/README.txt 1.17 KB
- The Children's Book Test/data/CBTest.tgz 114.96 MB