17일 전

스탠포드 신경망 기계 번역 시스템: 구두 언어 도메인을 위한 접근

{Minh-Thang Luong, Christopher D. Manning}
스탠포드 신경망 기계 번역 시스템: 구두 언어 도메인을 위한 접근
초록

신경망 기반 기계번역(Neural Machine Translation, NMT)은 최근 개발된 기술임에도 불구하고 다양한 언어 쌍에 대해 유망한 성과를 보여주고 있다. 그러나 현재까지 NMT는 주로 WMT 공동 과제에서처럼 공식적인 텍스트에만 적용되어 왔다. 본 연구는 IWSLT 2015의 번역(MT) 트랙에 참가함으로써 NMT 기술이 구어체 언어 영역에서의 효과성에 대해 추가적으로 탐구한다. 두 가지 시나리오를 고려한다: (a) 기존의 NMT 시스템을 새로운 도메인에 적응시키는 방법과 (b) 저자원 언어 쌍으로의 NMT 일반화 가능성. 실험 결과, 기존의 NMT 프레임워크를 활용함으로써 영어에서 독일어 및 베트남어로의 번역 시, 위 두 시나리오 모두에서 경쟁력 있는 성과를 달성할 수 있음을 입증하였다. 특히, IWSLT 영어-독일어 번역 트랙에서 기존 최고 성능을 최대 5.2 BLEU 포인트 상회하는 성과를 기록하며, 상태 기술( state-of-the-art) 수준을 한층 끌어올렸다.