11日前

教師あり手法に匹敵する非教師あり文法的誤り訂正

{Hwee Tou Ng, Yuchen Zhang, Liping Yuan, Hannan Cao}
教師あり手法に匹敵する非教師あり文法的誤り訂正
要約

最先端の文法誤り訂正(GEC)システムは、不文法な文とその手動で修正された対応文からなる並列学習データに依存しているが、このようなデータの構築は費用がかかる。本論文では、未監督型GECシステムの構築に「Break-It-Fix-It(BIFI)」手法を採用する。BIFIフレームワークは、ラベルなしテキストから、不文法な文を文法的に正しい文に変換する「修正器(fixer)」と、文の文法的妥当性を予測する「評価者(critic)」を用いて並列データを生成する。本研究では、修正器および評価者の未監督型学習アプローチを提示するとともに、両者が相互に反復的に改善できるアルゴリズムを提案する。提案手法は、英語および中国語のGECタスクにおいて評価された。実験結果から、従来の未監督GECシステムを上回る性能を達成し、アンサンブルを用いずに教師ありGECシステムと同等の性能を実現した。さらに、ラベル付き学習データと組み合わせた場合、CoNLL-2014およびNLPCC-2018のテストセットにおいて、新たな最先端の結果を達成した。

教師あり手法に匹敵する非教師あり文法的誤り訂正 | 最新論文 | HyperAI超神経