
要約
本論文では、従来広く用いられてきたClassifier-free Guidance(CFG)を克服・排除する新しい学習目的であるModel-guidance(MG)を提案する。本研究の革新性は、単にデータ分布をモデル化するという従来のアプローチを越え、条件付き事後確率(posterior probability of conditions)を組み込む点にあり、CFGの基本的なアイデアを発展させたものである。この手法は実装が簡単でありながら高い効果を発揮し、既存モデルに即座に組み込めるプラグアンドプレイ型モジュールとしての利便性を備えている。実験結果から、本手法は学習プロセスを顕著に高速化し、推論速度を2倍に向上させるとともに、CFGを用いた同時期の拡散モデルを上回る、あるいは同等の優れた品質を達成した。さまざまなモデルおよびデータセットにおける広範な実験により、本手法の有効性、効率性、スケーラビリティが確認された。最終的に、ImageNet 256ベンチマークにおいてFIDスコア1.34を達成し、最先端の性能を確立した。本研究のコードは、https://github.com/tzco/Diffusion-wo-CFG にて公開されている。