6ヶ月前

拡散モデル

画像間変換

アプローチ／フレームワーク

マルチモーダル

コンピュータビジョン

Prafulla Dhariwal Alex Nichol

概要

我々は、拡散モデルが現在の最先端生成モデルを上回る画像サンプル品質を達成できることを示す。非条件型画像生成においては、アブレーションの繰り返しを通じてより優れたアーキテクチャを発見することにより、その達成を実現した。条件付き画像生成では、分類器ガイド（classifier guidance）を用いてさらにサンプル品質を向上させた。これは、分類器からの勾配を利用して多様性と忠実度のトレードオフを効率的に行うシンプルかつ計算負荷の低い手法である。ImageNet 128×128ではFIDが2.97、256×256では4.59、512×512では7.72を達成し、サンプル1つあたりたった25回の前向き伝搬でさえBigGAN-deepと同等の性能を発揮した。さらに、分布のカバー率も優れており、生成分布の幅広いカバーを維持している。最後に、分類器ガイドがアップサンプリング拡散モデルと良好に組み合わせられ、ImageNet 256×256ではFIDを3.94、512×512では3.85まで改善することを確認した。本研究のコードは、https://github.com/openai/guided-diffusion にて公開している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

拡散モデル

画像間変換

アプローチ／フレームワーク

マルチモーダル

コンピュータビジョン

Prafulla Dhariwal Alex Nichol

概要

我々は、拡散モデルが現在の最先端生成モデルを上回る画像サンプル品質を達成できることを示す。非条件型画像生成においては、アブレーションの繰り返しを通じてより優れたアーキテクチャを発見することにより、その達成を実現した。条件付き画像生成では、分類器ガイド（classifier guidance）を用いてさらにサンプル品質を向上させた。これは、分類器からの勾配を利用して多様性と忠実度のトレードオフを効率的に行うシンプルかつ計算負荷の低い手法である。ImageNet 128×128ではFIDが2.97、256×256では4.59、512×512では7.72を達成し、サンプル1つあたりたった25回の前向き伝搬でさえBigGAN-deepと同等の性能を発揮した。さらに、分布のカバー率も優れており、生成分布の幅広いカバーを維持している。最後に、分類器ガイドがアップサンプリング拡散モデルと良好に組み合わせられ、ImageNet 256×256ではFIDを3.94、512×512では3.85まで改善することを確認した。本研究のコードは、https://github.com/openai/guided-diffusion にて公開している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

拡散モデルが画像合成においてGANを上回る | 記事 | HyperAI超神経