Command Palette

Search for a command to run...

4ヶ月前

教師あり手法に匹敵する非教師あり文法的誤り訂正

{Hwee Tou Ng Yuchen Zhang Liping Yuan Hannan Cao}

教師あり手法に匹敵する非教師あり文法的誤り訂正

要約

最先端の文法誤り訂正(GEC)システムは、不文法な文とその手動で修正された対応文からなる並列学習データに依存しているが、このようなデータの構築は費用がかかる。本論文では、未監督型GECシステムの構築に「Break-It-Fix-It(BIFI)」手法を採用する。BIFIフレームワークは、ラベルなしテキストから、不文法な文を文法的に正しい文に変換する「修正器(fixer)」と、文の文法的妥当性を予測する「評価者(critic)」を用いて並列データを生成する。本研究では、修正器および評価者の未監督型学習アプローチを提示するとともに、両者が相互に反復的に改善できるアルゴリズムを提案する。提案手法は、英語および中国語のGECタスクにおいて評価された。実験結果から、従来の未監督GECシステムを上回る性能を達成し、アンサンブルを用いずに教師ありGECシステムと同等の性能を実現した。さらに、ラベル付き学習データと組み合わせた場合、CoNLL-2014およびNLPCC-2018のテストセットにおいて、新たな最先端の結果を達成した。

ベンチマーク

ベンチマーク方法論指標
grammatical-error-correction-on-bea-2019-testUnsupervised GEC + cLang8
F0.5: 76.5
grammatical-error-correction-on-conll-2014Unsupervised GEC + cLang8
F0.5: 69.6
Precision: 75.0
Recall: 53.8

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
教師あり手法に匹敵する非教師あり文法的誤り訂正 | 論文 | HyperAI超神経