
要約
非監督ニューラル機械翻訳(NMT)は、ラベル付きデータを使用せずにモデルを訓練することを目指す最近提案された機械翻訳手法です。非監督NMTに提案されているモデルは、多くの場合、異なる言語の文ペアを共有潜在空間にマッピングするための単一の共有エンコーダのみを使用していますが、この方法では各言語の独自性や内部特性(スタイル、用語、文構造など)を維持することが弱いという問題があります。この課題に対処するために、当研究では2つの独立したエンコーダを使用しつつ、入力文の高レベル表現を抽出する責任を持つ一部の重みを共有する拡張手法を導入します。さらに、局所GAN(local GAN)と全体GAN(global GAN)という2種類の異なる生成対抗ネットワーク(GANs)を提案し、これにより言語間翻訳の精度向上を図ります。この新しいアプローチにより、英独翻訳、英仏翻訳および中英翻訳タスクにおいて大幅な改善が達成されました。