
초록
영어 문법 오류 수정은 오랫동안 연구되어 온 문제이며, 현재 많은 시스템과 데이터셋이 존재한다. 그러나 다른 언어에 대한 오류 수정에 관한 연구는 여전히 제한적이다. 본 논문에서는 체코어 문법 오류 수정을 위한 새로운 데이터셋 AKCES-GEC를 제안한다. 이후 체코어, 독일어, 러시아어에 대해 실험을 수행하여, 합성 병렬 코퍼스를 활용할 경우 Transformer 기반 신경 기계 번역 모델이 이들 데이터셋에서 새로운 최고 성능을 달성함을 보여준다. AKCES-GEC는 https://hdl.handle.net/11234/1-3057에서 CC BY-NC-SA 4.0 라이선스 하에 공개되었으며, GEC 모델의 소스 코드는 https://github.com/ufal/low-resource-gec-wnut2019에서 확인할 수 있다.