Brown Corpus 布朗语料库

日期

2 年前

大小

9.09 MB

机构

Brown University

发布地址

www.kaggle.com

布朗语料库是美国英语的首个文本语料库,它取自不同主题的报纸文本、书籍以及政府文件,包含 1,014,312 个单词的它主要用于语言建模。

原始语料库包含手动注释的句子、标记边界和单词类注释,转换的语料库则包含基于布朗语料库 TEI / XML 版本重建的完整文本,并通过 OLiA 连接到用于聚合查询的本体 Word 类中。

该语料库最初由布朗大学语言学系的 W. Nelson Francis 和 HenryKučera 于 1963 – 1964 年发布,相关论文有《Computational Analysis of Present-Day American English》。

Brown Corpus.torrent

做种 5

下载中 0

已完成 1,125

总下载 3,276

  • Brown Corpus/
    • README.md
      1.49 KB
    • README.txt
      2.97 KB
      • data/
        • Brown Corpus.zip
          9.09 MB