
摘要
我们提出两种基于归一化流(normalizing flows)的新评估指标,用于衡量生成图像的逼真度:一种更简单高效的基于流的似然距离(Flow-based Likelihood Distance, FLD),以及一种更为精确的双流似然距离(Dual-flow based Likelihood Distance, D-FLD)。由于归一化流能够精确计算似然值,所提出的指标可评估生成图像与目标域真实图像分布之间的接近程度。这一特性使我们的指标相较于广泛使用的弗雷切特 inception 距离(Fréchet Inception Distance, FID)及其他近期提出的指标具有若干优势。首先,所提指标仅需数百张图像即可实现稳定(均值收敛),而 FID 需要数万张图像,其他指标至少也需要数千张图像。这一特性使得我们能够对规模较小的生成图像集(如训练循环中的验证批次)进行可信评估。其次,用于计算本指标的网络参数量比用于 FID 计算的 Inception-V3 网络少一个数量级以上,因而具有更高的计算效率。在评估新领域(如 X 射线图像)生成图像的逼真度时,理想情况下应使用真实图像对模型进行再训练,以准确建模该领域的分布特征。因此,在新领域中,我们更小型的网络将展现出更大的优势。大量实验表明,所提出的指标与各类图像退化程度之间呈现出理想的单调关系,验证了其作为生成图像质量评估工具的有效性与可靠性。