BookCorpus 大型书籍文本数据集

数据集下载 磁力链 下载帮助

OpenBayes 注册即获得免费算力

BookCorpus 是一个曾经流行的大型文本语料库,经常用于语句编码/解码的无监督学习。 但是原作者已不再提供 BookCorpus 的下载。

目前这个 BookCorpus 数据集大部分数据源来自 smashwords.com 的免费书籍,与原始的 BookCorpus 几乎一致

3 做种 0 下载 366 已完成
文件名大小
.DS_Store8 KB
README.md1014 B
README.txt1014 B
books1.tar.gz2.24 GB