
초록
최근 연구에서는 단일 언어 말뭉치만을 사용하는 새로운 전용 아키텍처를 통해 신경망 기계 번역(NMT) 시스템의 완전 비지도 학습에서 뛰어난 결과를 달성하였습니다. 본 연구에서는 비지도 NMT(UNMT)를 합성된 이중 언어 데이터의 감독 아래로 훈련된 NMT로 정의하고자 합니다. 우리의 접근 방식은 인간이 만든 이중 언어 데이터를 합성된 이중 언어 데이터로 대체하여 훈련함으로써, 지도 NMT에 제안된 최신 아키텍처의 사용을 직관적으로 가능하게 합니다. 우리는 UNMT의 훈련을 비지도 통계적 기계 번역(USMT)을 통해 생성된 합성 이중 언어 데이터로 초기화하는 방법을 제안합니다. 그런 다음 UNMT 시스템은 역방향 번역(back-translation)을 사용하여 점진적으로 개선됩니다. 우리의 예비 실험 결과는 우리 접근 방식이 WMT16 독일어-영어 뉴스 번역 과제에서 양방향 번역 모두에 대해 비지도 기계 번역 분야에서 새로운 최고 수준의 성과를 달성함을 보여주고 있습니다.