
要約
生成対抗ネットワーク(GAN)の最近の進展により、高品質な合成画像を生成する目的で広く採用されるようになっている。これらのモデルは写真並みのリアルな画像を生成できるが、しばしばデータ多様体(data manifold)の外側に位置する現実的でないサンプルを生成してしまう。近年提案されたいくつかの手法は、生成後に不適切なサンプルを排除するか、あるいはモデルの潜在空間(latent space)を切り詰める方法によって、こうした不適切なサンプルを回避しようとしている。これらのアプローチは効果的ではあるが、生成されたサンプルの多くが最終的に使用されないため、訓練時間およびモデル容量の大部分が無駄になるという非効率性を抱えている。本研究では、サンプル品質を向上させるための新たなアプローチを提案する。具体的には、モデルの訓練を開始する前に、インスタンス選択(instance selection)を用いて訓練データセットを改良する方法である。訓練前に経験的データ分布を精緻化することで、モデルの表現力が高密度領域に集中し、結果としてサンプルの忠実度(fidelity)が向上し、モデル容量の要件が低下し、訓練時間も大幅に短縮される。コードは以下のURLから入手可能である:https://github.com/uoguelph-mlrg/instance_selection_for_gans。