Gutenberg Dataset 电子书数据集

下载帮助

Gutenberg 数据集包含 142 位作者的 3036 本英文书籍,是 Project Gutenberg 语料库的一小部分,主要被用于语言建模。

该数据集由密克罗夫特人工智能于 2014 年 4 月发布,主要发布人为 Matthew D. Scholefield,相关论文有《Complexity of Word Collocation Networks: A Preliminary Structural Analysis》。