ブラウン コーパス ブラウン コーパス

ブラウン コーパスは、さまざまなトピックに関する新聞テキスト、書籍、政府文書から取られた最初のテキスト コーパスであり、主に言語モデリングに使用されます。

元のコーパスには、手動で注釈が付けられた文、トークン境界、単語クラスの注釈が含まれており、変換されたコーパスには、ブラウン コーパスの TEI/XML バージョンに基づいて再構築され、集計クエリ用のオントロジー Word クラスに OLiA 経由で接続された完全なテキストが含まれています。

このコーパスは元々、ブラウン大学言語学部の W. ネルソン フランシスとヘンリー クチェラによって 1963 年から 1964 年に出版されました。関連する論文は「Computational Analysis of Present-Day American English」です。

Brown Corpus.torrent

做种 4

下载中 0

已完成 1,185

总下载 3,329

  • Brown Corpus/
    • README.md
      1.49 KB
    • README.txt
      2.97 KB
      • data/
        • Brown Corpus.zip
          9.09 MB