2ヶ月前

人間レベルの性能を達成した自動文法誤り訂正:実証的調査

Tao Ge; Furu Wei; Ming Zhou
人間レベルの性能を達成した自動文法誤り訂正:実証的調査
要約

ニューラルシーケンス・ツー・シーケンス(seq2seq)アプローチは、文法誤り訂正(GEC)においてその有効性が証明されています。本研究では、seq2seqフレームワークに基づき、新たな流暢性向上学習および推論メカニズムを提案します。流暢性向上学習は、訓練中に多様な誤り訂正文ペアを生成し、誤り訂正モデルがより多くの事例から文の流暢性を改善する方法を学ぶことを可能にします。一方、流暢性向上推論は、複数の推論ステップで文を段階的に訂正することを許可します。この流暢性向上学習と推論を畳み込み型seq2seqモデルと組み合わせることで、当方の手法は最先端の性能を達成しました:CoNLL-2014 10アノテーションデータセットでの75.72 (F_{0.5}) およびJFLEGテストセットでの62.42 (GLEU) です。これにより、両ベンチマークで人間レベルの性能(CoNLLで72.58、JFLEGで62.37)に達した最初のGECシステムとなりました。

人間レベルの性能を達成した自動文法誤り訂正:実証的調査 | 最新論文 | HyperAI超神経