Command Palette

Search for a command to run...

FCGEC 中国語文法エラー検出および修正データ セット

日付

2年前

サイズ

15.51 MB

組織

浙江大学

公開URL

github.com

論文URL

arxiv.org

ライセンス

非商用

FCGEC は、Fine-Grained Corpus for Chinese Grammatical Error Correction の略で、大規模なネイティブ スピーカー向けの複数参照テキスト修正コーパスです。  誤り訂正モデルシステムの学習と評価に使用されます。データソースは主に小・中・高校生の誤文テスト問題やニュース集約サイトです。

多様なアノテーションの目標を達成するために、より多くの参照変更方法を文に与えるために、各文はアノテーションのために 2 ~ 4 人のアノテーターにランダムに割り当てられます。2 つのデータ ソースから 54,026 の元の文を収集し、重複を除去して問題のある文 (テキストの切り捨てなど) を除外した後、FCGEC には合計 41,340 の文が含まれていました。

FCGEC.torrent
シーディング 2ダウンロード中 0ダウンロード完了 210総ダウンロード数 535
  • FCGEC/
    • README.md
      1.33 KB
    • README.txt
      2.65 KB
      • data/
        • FCGEC_test.json
          815.18 KB
        • FCGEC_train.json
          14.73 MB
        • FCGEC_valid.json
          15.51 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
FCGEC 中国語文法エラー検出および修正データ セット | データセット | HyperAI超神経