Inception Score (IS)
Der Inception Score (IS) ist eine objektive Leistungskennzahl, die zur Bewertung der Qualität generierter oder synthetischer Bilder verwendet wird, die von einem Generative Adversarial Network (GAN) erstellt werden. Es kann die Authentizität und Vielfalt der Ausgabebilder messen und auch als Ersatz für die subjektive menschliche Bewertung verwendet werden. IS ist nach FID (Frechlet Inception Distance) die zweitwichtigste Leistungskennzahl für die Bewertung.
Dieses Konzept wurde erstmals von Tim Salimans et al. vorgeschlagen. in ihrer Arbeit von 2016 „Verbesserte Techniken zum Trainieren von GANs“Eingeführt in. Es ist nach dem von Google für die Bildklassifizierung entwickelten Inception Network (einem auf dem Image Net-Datensatz vortrainierten Deep-Learning-Modell) benannt. Der Autor verwendete Inception Network, um den Merkmalsvektor des Bildes zu extrahieren.
Es misst zwei Aspekte:
- Vielfalt – Die generierten Bilder sollten sehr vielfältig sein – die Entropie der Gesamtverteilung sollte hoch sein.
- Die Güte – also die Qualität des generierten Bildes – erfordert eine geringe Entropie und eine hohe Vorhersagbarkeit.
Der niedrigste IS kann Null sein, der höchste IS kann unendlich sein und je höher der IS, desto besser.
Einschränkungen des Inception Score
- Wenn das Netzwerk nur ein Bild pro Klasse generiert, ist der IS hoch und stellt die Klasse nicht gut dar.
- Das Inception-Netzwerk wurde anhand des Imagenet-Datensatzes trainiert, der nur 1.000 Klassen enthält. Wenn Sie ein GAN auf Kategorien außerhalb dieser 1.000 trainieren, ist Ihr Inception-Score niedrig.
- Es funktioniert gut mit quadratischen und relativ kleinen Bildern – beispielsweise Bildern der Größe 300×300.
Verweise
【1】https://kailashahirwar.medium.com/a-very-short-introduction-to-inception-score-is-c9b03a7dd788