
초록
기계 번역은 전통적으로 대규모 병렬 말뭉치에 의존해 왔지만, 최근 연구 방향에서는 단일 언어 말뭉치만을 사용하여 신경망 기계 번역(Neural Machine Translation, NMT) 시스템과 통계적 기계 번역(Statistical Machine Translation, SMT) 시스템을 훈련시키는 데 성공했습니다. 본 논문에서는 기존의 비지도 SMT 접근 방식의 여러 부족점을 하위 단어 정보를 활용하고, 이론적으로 잘 설립된 비지도 조정 방법을 개발하며, 공동 정제 절차를 통합함으로써 해결합니다. 또한, 개선된 SMT 시스템을 사용하여 쌍방향 NMT 모델을 초기화하고, 실시간 역번역(back-translation)을 통해 추가로 미세 조정합니다. 이를 통해 비지도 기계 번역에서 이전 최고 수준보다 크게 향상된 결과를 얻었습니다. 예를 들어, 영어-독일어 WMT 2014에서 22.5 BLEU 점수를 달성했으며, 이는 이전 최고의 비지도 시스템보다 5.5점 높고, 2014년当时的监督任务获胜者(2014년当时的監督任務勝利者)보다도 0.5점 높습니다.注:在最后一句中,“当时的监督任务获胜者”被翻译为“당시의 감독 작업 승리자”,但由于括号内需要保持与原文一致,因此使用了汉字标注。如果不需要汉字标注,可以直接翻译为“当时の 감독 작업 승리자”。