7ヶ月前

拡散モデル

モデリング

アプローチ／フレームワーク

コンピュータビジョン

Yang Song Stefano Ermon

概要

新しい生成モデルを提案します。このモデルでは、サンプルはデータ分布の勾配をスコアマッチングにより推定し、ランジュバン動力学を用いて生成されます。低次元多様体上にデータが存在する場合、勾配は定義が不適切であるか、推定が困難であるため、異なるレベルのガウシアンノイズでデータを摂動し、対応するスコア（すなわち、すべてのノイズレベルに対する摂動データ分布の勾配ベクトル場）を共同で推定します。サンプリングに関しては、サンプリングプロセスがデータ多様体に近づくにつれて徐々に減少するノイズレベルに対応する勾配を使用する緩和ランジュバン動力学を提案します。当フレームワークは柔軟なモデルアーキテクチャを許容し、訓練中にサンプリングを行う必要や敵対的手法の使用を必要とせず、原理に基づいたモデル比較に使用できる学習目標も提供します。当モデルはMNIST、CelebAおよびCIFAR-10データセットにおいてGANと同等のサンプルを生成し、CIFAR-10における最新の最高インセプションスコア8.87を達成しました。さらに、画像補完実験を通じて当モデルが効果的な表現を学習していることを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

拡散モデル

モデリング

アプローチ／フレームワーク

コンピュータビジョン

Yang Song Stefano Ermon

概要

新しい生成モデルを提案します。このモデルでは、サンプルはデータ分布の勾配をスコアマッチングにより推定し、ランジュバン動力学を用いて生成されます。低次元多様体上にデータが存在する場合、勾配は定義が不適切であるか、推定が困難であるため、異なるレベルのガウシアンノイズでデータを摂動し、対応するスコア（すなわち、すべてのノイズレベルに対する摂動データ分布の勾配ベクトル場）を共同で推定します。サンプリングに関しては、サンプリングプロセスがデータ多様体に近づくにつれて徐々に減少するノイズレベルに対応する勾配を使用する緩和ランジュバン動力学を提案します。当フレームワークは柔軟なモデルアーキテクチャを許容し、訓練中にサンプリングを行う必要や敵対的手法の使用を必要とせず、原理に基づいたモデル比較に使用できる学習目標も提供します。当モデルはMNIST、CelebAおよびCIFAR-10データセットにおいてGANと同等のサンプルを生成し、CIFAR-10における最新の最高インセプションスコア8.87を達成しました。さらに、画像補完実験を通じて当モデルが効果的な表現を学習していることを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています