
要約
私たちはFineGANという新しい非教師ありのGAN(Generative Adversarial Network)フレームワークを提案します。このフレームワークは、背景、オブジェクト形状、オブジェクト外観を階層的に分離し、細かいオブジェクトカテゴリの画像を生成します。教師なしでこれらの要因を分離するために、私たちの主要なアイデアは情報理論を使用して各要因を潜在コードに結びつけ、コード間の関係を特定の方法で条件付けすることで、望ましい階層構造を誘導することです。広範な実験を通じて、FineGANが鳥、犬、車などの細かいクラスに属する現実的で多様な画像を生成するための必要な分離を達成していることを示しています。また、FineGANが自動的に学習した特徴量を使用して、教師なしで細かいオブジェクトカテゴリの発見という新たな問題への最初の一歩として実際の画像をクラスタリングすることも行っています。当該研究に関するコードやモデル、デモは以下のURLから入手可能です: https://github.com/kkanshul/finegan