
要約
私たちは、WMT 2016の共有ニュース翻訳タスクに参加するために、4つの言語ペア(英語<>チェコ語、英語<>ドイツ語、英語<>ルーマニア語、英語<>ロシア語)の双方向で訓練されたニューラル翻訳システムを構築しました。これらのシステムは、固定したボキャブラリーを使用してオープンボキャブラリ翻訳を行うBPEサブワード分割を用いた注意機構付きエンコーダー-デコーダーに基づいています。私たちは、単一言語のニュースコーパスの自動逆翻訳を追加の訓練データとして使用すること、広範なドロップアウト技術、および目標双方向モデルについて実験を行いました。報告されているすべての手法は大幅な改善をもたらし、ベースラインシステムに対して4.3~11.2 BLEUポイントの向上が見られました。人間による評価では、私たちのシステムは参加した8つの翻訳方向のうち7つで最優秀(または同率最優秀)制約付きシステムと評価されました。