2달 전
Facebook FAIR의 WMT19 뉴스 번역 작업 제출
Nathan Ng; Kyra Yee; Alexei Baevski; Myle Ott; Michael Auli; Sergey Edunov

초록
본 논문은 Facebook FAIR의 WMT19 공유 뉴스 번역 작업에 대한 제출 내용을 설명합니다. 우리는 영어 ↔ 독일어와 영어 ↔ 러시아어 두 가지 언어 쌍과 네 가지 방향에서 참여하였습니다. 작년 제출작과 마찬가지로, 우리의 기준 시스템은 샘플링된 역번역에 의존하는 Fairseq 시퀀스 모델링 툴킷으로 훈련된 큰 BPE(바이트 쌍 인코딩) 기반 트랜스포머 모델입니다. 올해는 다양한 양문장 데이터 필터링 방법과 필터링된 역번역 데이터를 추가하는 실험을 수행하였습니다. 또한, 도메인 특화 데이터로 모델을 앙상블하고 미세 조정한 후, 노이즈 채널 모델 리랭킹을 사용하여 디코딩하였습니다. 인간 평가 캠페인의 모든 네 가지 방향에서 우리의 제출작은 1위를 차지하였으며, 특히 영어 → 독일어 방향에서는 다른 시스템뿐만 아니라 인간 번역보다도 크게 우수한 성능을 보였습니다. 이 시스템은 WMT'18 제출작 대비 4.5 BLEU 포인트 개선되었습니다.