17日前
スコアベース拡散モデルにおける識別子ガイダンスを用いた生成プロセスの精緻化
Dongjun Kim, Yeongmin Kim, Se Jung Kwon, Wanmo Kang, Il-Chul Moon

要約
提案される手法「ディスクリミネーターガイダンス(Discriminator Guidance)」は、事前学習された拡散モデルにおけるサンプル生成の品質を向上することを目的としている。本手法は、ノイズ除去過程におけるサンプルが現実的かどうかを明示的に監視するためのディスクリミネーターを導入している。GANとは異なり、本手法ではスコアネットワークとディスクリミネーターの同時学習を必要としない。代わりに、スコアネットワークの学習が完了した後にディスクリミネーターを別途学習するため、ディスクリミネーターの学習は安定しており、迅速に収束する。サンプル生成の際には、事前学習済みのスコア関数に補助項を追加し、ディスクリミネーターを欺くように設計している。この補助項により、最適なディスクリミネーターにおいてモデルスコアがデータスコアに補正され、ディスクリミネーターがスコア推定を補完的に改善する効果があることが示唆される。本アルゴリズムを用いることで、ImageNet 256×256におけるFIDスコア1.83、リコール0.64という、検証データのFID(1.68)およびリコール(0.66)と類似した最先端の性能を達成した。コードは https://github.com/alsdudrla10/DG にて公開している。