2ヶ月前

Facebook FAIRのWMT19ニュース翻訳タスク提出

Nathan Ng; Kyra Yee; Alexei Baevski; Myle Ott; Michael Auli; Sergey Edunov
Facebook FAIRのWMT19ニュース翻訳タスク提出
要約

本論文では、Facebook FAIRがWMT19の共有ニュース翻訳タスクに提出した内容について説明します。我々は2つの言語ペアと4つの言語方向(英語↔ドイツ語、英語↔ロシア語)で参加しました。昨年の提出に引き続き、我々のベースラインシステムはFairseqシーケンスモデリングツールキットを使用して訓練された大規模なBPEベースのトランスフォーマーモデルであり、サンプリングされたバック翻訳に依存しています。今年は異なるバイテキストデータフィルタリング手法を実験し、フィルタリングされたバック翻訳データを追加することも試みました。また、ドメイン固有のデータでモデルをアンサンブル化および微調整し、ノイジーチャネルモデルによるリランキングを使用してデコードを行いました。我々の提出は、人間評価キャンペーンの4つの方向すべてで1位となりました。特に英語→ドイツ語において、他のシステムや人間の翻訳を大幅に上回る性能を示しました。このシステムは、我々のWMT'18提出から4.5 BLEUポイント向上しています。