Métrique basée sur les flows de normalisation pour la génération d’images

Nous proposons deux nouvelles métriques d’évaluation pour mesurer la réalisme des images générées à partir des flows de normalisation : une distance de vraisemblance basée sur les flows (FLD), plus simple et efficace, et une distance de vraisemblance basée sur un dual-flow (D-FLD), plus précise. Étant donné que les flows de normalisation permettent de calculer la vraisemblance exacte, les métriques proposées évaluent avec précision la proximité entre la distribution des images générées et celle des images réelles d’un domaine donné. Cette propriété confère aux métriques proposées plusieurs avantages par rapport à la distance de Fréchet inception (FID), largement utilisée, ainsi qu’à d’autres métriques récentes. Premièrement, ces nouvelles métriques atteignent une stabilité (convergence en moyenne) avec seulement quelques centaines d’images, contre des dizaines de milliers nécessaires pour la FID, et au moins quelques milliers pour les autres métriques. Cela permet une évaluation fiable même sur de petits ensembles d’images générées, tels que les lots de validation au sein des boucles d’entraînement. Deuxièmement, le réseau utilisé pour calculer ces métriques comporte plus d’un ordre de grandeur de paramètres en moins que le réseau Inception-V3 utilisé pour la FID, ce qui en fait une solution plus efficace sur le plan computationnel. Pour évaluer le réalisme des images générées dans de nouveaux domaines (par exemple, des images aux rayons X), il est idéal de réentraîner ces réseaux sur des images réelles afin de modéliser leurs distributions spécifiques. Dans ce contexte, notre réseau plus petit s’avère encore plus avantageux. Des expériences étendues montrent que les métriques proposées présentent les relations monotones souhaitées en fonction du degré de dégradation de divers types d’images.