2달 전

비감독 기계 번역의 효과적인 접근 방법

Mikel Artetxe; Gorka Labaka; Eneko Agirre
비감독 기계 번역의 효과적인 접근 방법
초록

기계 번역은 전통적으로 대규모 병렬 말뭉치에 의존해 왔지만, 최근 연구 방향에서는 단일 언어 말뭉치만을 사용하여 신경망 기계 번역(Neural Machine Translation, NMT) 시스템과 통계적 기계 번역(Statistical Machine Translation, SMT) 시스템을 훈련시키는 데 성공했습니다. 본 논문에서는 기존의 비지도 SMT 접근 방식의 여러 부족점을 하위 단어 정보를 활용하고, 이론적으로 잘 설립된 비지도 조정 방법을 개발하며, 공동 정제 절차를 통합함으로써 해결합니다. 또한, 개선된 SMT 시스템을 사용하여 쌍방향 NMT 모델을 초기화하고, 실시간 역번역(back-translation)을 통해 추가로 미세 조정합니다. 이를 통해 비지도 기계 번역에서 이전 최고 수준보다 크게 향상된 결과를 얻었습니다. 예를 들어, 영어-독일어 WMT 2014에서 22.5 BLEU 점수를 달성했으며, 이는 이전 최고의 비지도 시스템보다 5.5점 높고, 2014년当时的监督任务获胜者(2014년当时的監督任務勝利者)보다도 0.5점 높습니다.注:在最后一句中,“当时的监督任务获胜者”被翻译为“당시의 감독 작업 승리자”,但由于括号内需要保持与原文一致,因此使用了汉字标注。如果不需要汉字标注,可以直接翻译为“当时の 감독 작업 승리자”。

비감독 기계 번역의 효과적인 접근 방법 | 최신 연구 논문 | HyperAI초신경