Command Palette
Search for a command to run...
InfoGAN: 情報最大化生成対抗ネットワークによる解釈可能な表現学習
InfoGAN: 情報最大化生成対抗ネットワークによる解釈可能な表現学習
Xi Chen Yan Duan Rein Houthooft John Schulman Ilya Sutskever Pieter Abbeel
概要
本論文では、完全非監督的な方法で解離表現を学習できる生成対抗ネットワーク(Generative Adversarial Network: GAN)の情報理論的な拡張版であるInfoGANについて説明します。InfoGANは、潜在変数の小さな部分集合と観測値との間の相互情報を最大化する生成対抗ネットワークです。我々は、効率的に最適化可能な相互情報目的関数の下界を導出し、その学習手順がWake-Sleepアルゴリズムの変形として解釈できることを示します。特に、InfoGANはMNISTデータセットにおいて書体と数字の形状を解離し、3Dレンダリング画像において姿勢と照明を解離し、SVHNデータセットにおいて背景の数字と中央の数字を解離することに成功しました。また、CelebA顔データセットにおいて髪型、眼鏡の有無、感情などの視覚的概念も発見しています。実験結果から、InfoGANは既存の完全教師あり手法で学習された表現と競合する解釈可能な表現を学習することが示されています。