
초록
우리는 위키백과의 수정 기록에서 추출한 편집 데이터를 활용하여 소규모 골드(Gold) GEC 코퍼스를 보완함으로써 독일어 문법 오류 수정(Grammatical Error Correction, GEC) 시스템을 개발하였다. 우리는 Bryant 등(2017)이 제안한 자동 오류 주석 도구 ERRANT을 독일어에 맞게 확장하여, 골드 GEC 수정 사례와 위키백과의 편집 기록(Grundkiewicz 및 Junczys-Dowmunt, 2014)을 분석함으로써, 골드 코퍼스의 문법 수정과 유사한 수정을 포함한 위키백과 편집 데이터를 추가 학습 데이터로 선별하였다. 다층 컨볼루션 인코더-디코더 신경망 기반의 GEC 접근법(Chollampatt 및 Ng, 2018)을 사용하여 위키백과 편집 데이터의 기여도를 평가한 결과, 신중하게 선택된 위키백과 편집 데이터는 성능을 5% 이상 향상시켰다.