11日前
人間は過ちを犯すが、ラマもそれを学ぶことができる
Agnes Luhtaru, Taido Purason, Martin Vainikko, Maksym Del, Mark Fishel

要約
本研究では、言語モデル(LM)を用いた人工誤り生成(AEG)を通じて文法誤り訂正(GEC)の性能向上を検討する。具体的には、Llama 2を基盤とするLMを誤り生成のためにファインチューニングし、その手法により人間が犯す誤りに類似した合成誤りを生成できることを確認した。次に、これらの人工誤りを用いてGEC用のLlamaモデルを訓練した結果、ドイツ語、ウクライナ語、エストニア語の全テスト言語において、従来の最先端モデルを上回る性能を達成し、F0.5スコアで0.8~6ポイントの向上を実現した。さらに、小規模なシーケンス・トゥ・シーケンスモデルをファインチューニングして誤りを生成する方法、および大規模な商用LM(GPT-3.5およびGPT-4)をプロンプトで操作する手法も、誤り生成モデルに有益な合成誤りを生成できることを実証した。