17日前

データ効率的なインスタンス生成:インスタンス判別からのアプローチ

Ceyuan Yang, Yujun Shen, Yinghao Xu, Bolei Zhou
データ効率的なインスタンス生成:インスタンス判別からのアプローチ
要約

生成対抗ネットワーク(GAN)は画像合成分野において顕著な進展を遂げてきたが、訓練データが限られている場合、合成品質は著しく低下する。GANの訓練におけるデータ効率を向上させるために、従来の手法ではデータ拡張を用いて識別器の過学習を緩和しつつも、依然として識別器に二値分類(本物対偽物)のタスクを課している。本研究では、インスタンス識別に基づくデータ効率の高いインスタンス生成(InsGen)手法を提案する。具体的には、本物領域と偽物領域を区別するだけでなく、訓練データセットからも生成器からも得られる個々の画像をすべて区別するよう識別器に要求する。これにより、識別器は無限に生成可能な合成サンプルを活用して訓練でき、訓練データ不足に起因する過学習の問題を緩和することができる。さらに、ノイズ摂動戦略を導入することで、識別器の識別能力を向上させる。一方で、識別器から学習されたインスタンス識別能力を逆に活用し、生成器が多様な画像を生成するように促進する。広範な実験により、本手法が多数のデータセットおよび訓練設定において有効であることが示された。特に、FFHQデータセットから2,000枚の画像を訓練データとして使用する設定において、最先端手法と比較してFIDスコアで23.5%の改善を達成した。