ブラウン コーパスは、さまざまなトピックに関する新聞テキスト、書籍、政府文書から取られた最初のテキスト コーパスであり、主に言語モデリングに使用されます。
元のコーパスには、手動で注釈が付けられた文、トークン境界、単語クラスの注釈が含まれており、変換されたコーパスには、ブラウン コーパスの TEI/XML バージョンに基づいて再構築され、集計クエリ用のオントロジー Word クラスに OLiA 経由で接続された完全なテキストが含まれています。
このコーパスは元々、ブラウン大学言語学部の W. ネルソン フランシスとヘンリー クチェラによって 1963 年から 1964 年に出版されました。関連する論文は「Computational Analysis of Present-Day American English」です。
做种 4
下载中 0
已完成 1,185
总下载 3,329