11日前

リソースが限られた状況における文法的誤り訂正

Jakub Náplava, Milan Straka
リソースが限られた状況における文法的誤り訂正
要約

英語における文法的誤り訂正は長年にわたり広く研究されてきた問題であり、多くの既存のシステムやデータセットが存在する。しかし、他の言語に対する誤り訂正に関する研究は限定的である。本論文では、チェコ語向けの文法的誤り訂正を目的とした新たなデータセット「AKCES-GEC」を提示する。さらに、チェコ語、ドイツ語、ロシア語に対して実験を行い、合成平行コーパスを活用することで、Transformerを用いたニューラル機械翻訳モデルがこれらのデータセットにおいて、新たな最先端(SOTA)の性能を達成できることを示した。AKCES-GECは、https://hdl.handle.net/11234/1-3057 にて CC BY-NC-SA 4.0 ライセンスのもと公開されており、GECモデルのソースコードは https://github.com/ufal/low-resource-gec-wnut2019 にて入手可能である。

リソースが限られた状況における文法的誤り訂正 | 最新論文 | HyperAI超神経