FCGEC は、Fine-Grained Corpus for Chinese Grammatical Error Correction の略で、大規模なネイティブ スピーカー向けの複数参照テキスト修正コーパスです。 誤り訂正モデルシステムの学習と評価に使用されます。データソースは主に小・中・高校生の誤文テスト問題やニュース集約サイトです。
多様なアノテーションの目標を達成するために、より多くの参照変更方法を文に与えるために、各文はアノテーションのために 2 ~ 4 人のアノテーターにランダムに割り当てられます。2 つのデータ ソースから 54,026 の元の文を収集し、重複を除去して問題のある文 (テキストの切り捨てなど) を除外した後、FCGEC には合計 41,340 の文が含まれていました。
做种 1
下载中 0
已完成 94
总下载 379