11日前

拡散モデルが画像合成においてGANを上回る

Prafulla Dhariwal, Alex Nichol
拡散モデルが画像合成においてGANを上回る
要約

我々は、拡散モデルが現在の最先端生成モデルを上回る画像サンプル品質を達成できることを示す。非条件型画像生成においては、アブレーションの繰り返しを通じてより優れたアーキテクチャを発見することにより、その達成を実現した。条件付き画像生成では、分類器ガイド(classifier guidance)を用いてさらにサンプル品質を向上させた。これは、分類器からの勾配を利用して多様性と忠実度のトレードオフを効率的に行うシンプルかつ計算負荷の低い手法である。ImageNet 128×128ではFIDが2.97、256×256では4.59、512×512では7.72を達成し、サンプル1つあたりたった25回の前向き伝搬でさえBigGAN-deepと同等の性能を発揮した。さらに、分布のカバー率も優れており、生成分布の幅広いカバーを維持している。最後に、分類器ガイドがアップサンプリング拡散モデルと良好に組み合わせられ、ImageNet 256×256ではFIDを3.94、512×512では3.85まで改善することを確認した。本研究のコードは、https://github.com/openai/guided-diffusion にて公開している。

拡散モデルが画像合成においてGANを上回る | 最新論文 | HyperAI超神経