2ヶ月前

機械翻訳と文法パターンを用いた人工的な誤り生成

Marek Rei; Mariano Felice; Zheng Yuan; Ted Briscoe
機械翻訳と文法パターンを用いた人工的な誤り生成
要約

利用可能なトレーニングデータの不足が自動的な誤り検出分野の進歩を阻害しています。本論文では、文章の誤りを人工的に生成する2つの代替手法について調査し、追加のリソースを作成することを目指します。我々は誤り生成を機械翻訳タスクとして扱うことを提案します。ここで、文法的に正しいテキストを誤りを含むテキストに「翻訳」します。さらに、アノテーション付きコーパスからテキストパターンを抽出するシステムを探求し、これらのパターンを利用して文法的に正しい文に誤りを挿入します。実験結果は、FCEおよびCoNLL 2014データセットにおいて、人工的に生成された誤りの包含が誤り検出精度を大幅に向上させることを示しています。

機械翻訳と文法パターンを用いた人工的な誤り生成 | 最新論文 | HyperAI超神経