
要約
最近の研究では、単一言語コーパスのみを使用する新しい専用アーキテクチャを用いて、完全に教師なしでニューラル機械翻訳(NMT)システムの訓練が達成され、著しい成果が得られています。本研究では、教師なしNMT(UNMT)を合成双方向データの監視のもとで訓練されたNMTとして定義することを提案します。当方針は、教師ありNMTのために提案された最先端のアーキテクチャを使用することを可能にし、訓練に人間が作成した双方向データのかわりに合成双方向データを使用します。私たちは、UNMTの訓練を教師なし統計的機械翻訳(USMT)によって生成された合成双方向データで初期化することを提案します。その後、逆翻訳を使用してUNMTシステムを段階的に改善します。私たちの初步的な実験結果は、WMT16ドイツ語-英語ニュース翻訳タスクにおいて両方向の翻訳に対して教師なし機械翻訳における新たな最先端の成果を達成していることを示しています。