日期
机构
发布地址
web.eecs.umich.edu
标签
国外高校
客服
社交
自然语言处理
分类
文本分类
文本检测
Gutenberg 数据集包含 142 位作者的 3036 本英文书籍,是 Project Gutenberg 语料库的一小部分,主要被用于语言建模。
该数据集由密克罗夫特人工智能于 2014 年 4 月发布,主要发布人为 Matthew D. Scholefield,相关论文有《Complexity of Word Collocation Networks: A Preliminary Structural Analysis》。