
要約
本稿では、同時的な推論(再構成)と合成(サンプリング)を実行する生成型オートエンコーダーの性能を向上させるために、二重の対立的特徴損失(dual contradistinctive losses)を導入した新たな生成型オートエンコーダーモデルを提案する。本モデルは「二重対立的生成型オートエンコーダー(Dual Contradistinctive Variational Autoencoder, DC-VAE)」と命名し、インスタンスレベルの識別損失(再構成・合成におけるインスタンスレベルの忠実性を維持)とセットレベルの敵対的損失(再構成・合成におけるセットレベルの忠実性を促進)の両方を組み合わせた、相互に対立的かつ特徴的な損失構造を採用している。DC-VAEの性能は、32×32、64×64、128×128、512×512と複数の解像度において広範な実験を通じて評価された。VAEにおける二つの対立的特徴損失は、DC-VAEにおいて調和的に機能し、アーキテクチャの変更なしにベースラインのVAEと比較して顕著な定性的・定量的な性能向上を達成した。画像再構成、画像合成、画像補間、表現学習といったタスクにおいて、既存の最先端または競合レベルの結果が得られた。DC-VAEは汎用的なVAEモデルとして、コンピュータビジョンおよび機械学習分野における多様な下流タスクに応用可能である。