インセプションスコア (IS)

インセプション スコア (IS) は、敵対的生成ネットワーク (GAN) によって生成された生成または合成イメージの品質を評価するために使用される客観的なパフォーマンス指標です。出力画像の信頼性や多様性を測定でき、人間の主観的な評価を代替するためにも使用できます。 IS は、FID (Frechlet Inception Distance) に次いで 2 番目に重要な評価性能指標です。

この概念は、Tim Salimans らによって 2016 年の論文で導入されました。 「GAN をトレーニングするための改良された技術」で紹介されました。その名前は、画像分類のために Google によって開発された Inception Network (Image net データ セットで事前トレーニングされた深層学習モデル) に由来しています。著者は、Inception Network を使用して画像の特徴ベクトルを抽出しました。

次の 2 つの側面を測定します。

  • 多様性 - さまざまな画像が生成されます - 全体の分布のエントロピーは高くなります。
  • 品質 (生成された画像がどの程度優れているか) には、エントロピーが低く、予測可能性が高いことが必要です。

最低の IS はゼロ、最高の IS は無限大、IS が高いほど優れています。

インセプションスコアの制限

  1. ネットワークがクラスごとに 1 つのイメージしか生成しない場合、IS は高く、クラスを適切に表現できません。
  2. Inception ネットワークは、1,000 クラスのみを含む Imagenet データセットでトレーニングされます。これら 1,000 以外のカテゴリで GAN をトレーニングすると、インセプション スコアは非常に低くなります。
  3. 正方形および比較的小さいサイズの画像 (たとえば、300×300 サイズの画像) に適しています。

参考文献

【1】https://kailashahirwar.medium.com/a-very-short-introduction-to-inception-score-is-c9b03a7dd788