12日前

文法的誤り検出における誤り特異的および文法的正しさ特異的単語埋め込みの利用

{Yuya Sakaizawa, Masahiro Kaneko, Mamoru Komachi}
文法的誤り検出における誤り特異的および文法的正しさ特異的単語埋め込みの利用
要約

本研究では、文法的正しさと誤りパターンを考慮した単語埋め込み(word embeddings)の学習により、文法的誤り検出の性能を向上させた。既存の大多数の単語埋め込み学習アルゴリズムは、単語の構文的文脈のみをモデル化するため、分類器が誤りのある語と正しい語を類似した入力として扱ってしまうという問題がある。本研究では、学習者による誤りを考慮することで、文脈情報の不足という課題に取り組んだ。具体的には、文法的誤りパターンを活用するモデルと、対象語の文法的正しさを考慮するモデルの2種類を提案した。n-gram列の文法的正しさは、アノテーション済みの誤りタグから判定し、大規模な学習者コーパスから文法的誤りパターンを抽出して、単語埋め込みに用いた。実験の結果、本研究で提案する単語埋め込みで初期化された双方向長短期記憶(bidirectional LSTM)モデルが、ファースト・セラティフィケート・イン・イングリッシュ(FCE)データセットにおける英語文法誤り検出タスクにおいて、従来の手法と比べて大幅に高い精度を達成し、最先端の性能を実現した。

文法的誤り検出における誤り特異的および文法的正しさ特異的単語埋め込みの利用 | 最新論文 | HyperAI超神経