
要約
最近、クロスドメインの画像間変換に用いられる条件付き生成対抗ネットワーク(GANs)は大きな進歩を遂げています。タスクの複雑さにより、数千から数百万のラベル付き画像ペアが必要とされます。しかし、人間によるラベリングはコストが高く、実際的でない場合もあり、大量のデータが常に利用できるとは限りません。自然言語翻訳における双方向学習のアイデアに着想を得て、我々は新しい双方向GANメカニズムを開発しました。このメカニズムにより、2つのドメインからの未ラベル画像セットを使用して画像変換器を訓練することが可能になります。当方のアーキテクチャでは、主GANがドメインUの画像をドメインVの画像に変換する方法を学習し、双方向GANがその逆タスクを学習します。主タスクと双方向タスクによって形成される閉ループにより、どちらのドメインからの画像も変換され、その後再構築されます。したがって、画像の再構築誤差を考慮に入れた損失関数を使用して変換器を訓練することができます。未ラベルデータを使用した複数の画像変換タスクでの実験結果は、単一のGANに対してDualGANが大幅な性能向上を示すことを示しています。一部のタスクでは、完全にラベル付けされたデータで訓練された条件付きGANと比較しても同等またはやや優れた結果を得ることができます。注:「DualGAN」は「双方向GAN」と訳しました。「primal GAN」は「主GAN」と訳し、「dual GAN」は「双方向GAN」と訳しました。これらの用語は日本語でも一般的に使用されています。