6ヶ月前

拡散モデル

モデリング

マルチモーダル

アプローチ／フレームワーク

マルチモーダル

Huangjie Zheng Pengcheng He Weizhu Chen Mingyuan Zhou

概要

拡散過程を用いた生成モデルは、データをノイズ分布に徐々に写像する前向き拡散チェーンを用い、その逆方向の拡散チェーンを推論することでデータ生成の方法を学習する。しかし、このアプローチは前向きおよび逆向きのステップを多数必要とするため、計算が遅く、コストが高くなる。本研究では、データが完全なランダムノイズに達するまでノイズを加えるのではなく、信頼できる形で学習可能な「隠れたノイズ付きデータ分布」に達するまでノイズを加える、より高速かつ低コストなアプローチを提案する。その後、この隠れた分布（ノイズ付きデータと類似した分布）から出発し、少ない逆向きステップでデータを生成する。我々は、提案モデルが、拡散プロセスと学習可能な暗黙的事前分布（implicit prior）を統合した敵対的オートエンコーダー（adversarial auto-encoder）として定式化できることを明らかにした。実験結果から、逆向き拡散ステップ数を大幅に削減しても、無制限（non-truncated）モデルに比べて、無条件画像生成およびテキスト誘導型画像生成の両面において、一貫した性能向上が得られることを示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

拡散モデル

モデリング

マルチモーダル

アプローチ／フレームワーク

マルチモーダル

Huangjie Zheng Pengcheng He Weizhu Chen Mingyuan Zhou

概要

拡散過程を用いた生成モデルは、データをノイズ分布に徐々に写像する前向き拡散チェーンを用い、その逆方向の拡散チェーンを推論することでデータ生成の方法を学習する。しかし、このアプローチは前向きおよび逆向きのステップを多数必要とするため、計算が遅く、コストが高くなる。本研究では、データが完全なランダムノイズに達するまでノイズを加えるのではなく、信頼できる形で学習可能な「隠れたノイズ付きデータ分布」に達するまでノイズを加える、より高速かつ低コストなアプローチを提案する。その後、この隠れた分布（ノイズ付きデータと類似した分布）から出発し、少ない逆向きステップでデータを生成する。我々は、提案モデルが、拡散プロセスと学習可能な暗黙的事前分布（implicit prior）を統合した敵対的オートエンコーダー（adversarial auto-encoder）として定式化できることを明らかにした。実験結果から、逆向き拡散ステップ数を大幅に削減しても、無制限（non-truncated）モデルに比べて、無条件画像生成およびテキスト誘導型画像生成の両面において、一貫した性能向上が得られることを示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています