Inception Score (IS)

Inception Score (IS) 是一种客观性能指标,用于评估由生成对抗网络 (GAN) 生成的生成图像或合成图像的质量。它可以衡量输出图像的真实性和多样性,也可以用来代替人类的主观评价。 IS 是继 FID (Frechlet Inception Distance) 之后的第二重要的评估性能指标。

这个概念是由 Tim Salimans 等人在 2016 年的论文 「Improved Techniques for Training GANs」中引入的。它的命名来源于 Google 开发的 Inception Network(一个在 Image net 数据集上预训练的深度学习模型),用于图像分类。作者使用了 Inception Network 来提取图像的特征向量。

它衡量两个方面:

  • 多样性(Variety)—生成的图像有多种多样 —整体分布的熵应该很高。
  • 质量(Goodness)—生成的图像有多好 —需要低熵和高可预测性。

最低的 IS 可以是零,最高的 IS 可以是无穷大,IS 越高越好。

Inception Score 的局限性

  1. 如果网络只为每个类生成一张图像,IS 将会很高,不能很好地表示类。
  2. Inception 网络在仅包含 1,000 个类的 Imagenet 数据集上进行训练。如果您在这 1,000 个类别之外的类别上训练 GAN,则 Inception 分数将会很低。
  3. 它适用于方形和相对较小尺寸的图像 – 例如 300×300 大小的图像。

参考来源

【1】https://kailashahirwar.medium.com/a-very-short-introduction-to-inception-score-is-c9b03a7dd788