17日前

画像生成におけるノーマライズドフローに基づくメトリクス

Pranav Jeevan, Neeraj Nixon, Amit Sethi
画像生成におけるノーマライズドフローに基づくメトリクス
要約

本稿では、正規化フロー(normalizing flows)に基づいて生成画像の現実性を評価するための2つの新しい評価指標を提案する。一つはより単純かつ効率的なフローに基づく尤度距離(Flow-based Likelihood Distance: FLD)、もう一つはより高精度な二重フローに基づく尤度距離(Dual-flow based Likelihood Distance: D-FLD)である。正規化フローは正確な尤度を計算できるため、提案指標は生成画像が特定ドメインの実画像分布とどれだけ類似しているかを評価できる。この特性により、広く用いられているFréchet Inception距離(FID)や他の最近の指標と比べて、いくつかの利点を持つ。第一に、FIDには数万枚、他の指標には少なくとも数千枚が必要とされるのに対し、提案指標は数百枚程度の画像で平均値が安定(収束)する。これにより、訓練ループ内の検証バッチなど、小規模な生成画像群に対しても信頼性の高い評価が可能となる。第二に、FIDの計算に用いられるInception-V3と比較して、提案指標の計算に用いるネットワークのパラメータ数は1桁以上少ないため、計算効率が著しく高い。新しいドメイン(例:X線画像)における生成画像の現実性を評価する場合、理想的には実画像上でネットワークを再学習し、そのドメイン特有の分布を正確にモデル化する必要がある。この点において、より小さなネットワークである提案指標は、新ドメインへの適用においてさらに大きな利点を持つ。広範な実験により、提案指標がさまざまな画像劣化の程度と望ましい単調性(monotonicity)の関係を示すことが確認された。

画像生成におけるノーマライズドフローに基づくメトリクス | 最新論文 | HyperAI超神経