11日前

エントロピー駆動型サンプリングおよび条件付き拡散生成のための訓練スキーム

Shengming Li, Guangcong Zheng, Hui Wang, Taiping Yao, Yang Chen, Shoudong Ding, Xi Li
エントロピー駆動型サンプリングおよび条件付き拡散生成のための訓練スキーム
要約

ノイズ除去拡散確率モデル(Denoising Diffusion Probabilistic Model, DDPM)は、事前ノイズから実データへの柔軟な条件付き画像生成を可能にする。これは、各ノイズ除去ステップにおいて、独立したノイズ認識分類器を導入し、条件付き勾配ガイドを提供することによって実現される。しかし、分類器が高レベルな構造のみで不完全に生成された画像を容易に識別できることから、クラス情報に基づく勾配が早期に消失する傾向があり、結果として条件付き生成プロセスが無条件生成プロセスへと崩壊してしまう問題が生じる。この問題に対処するため、二つの視点からシンプルながら効果的なアプローチを提案する。サンプリング手順においては、予測分布のエントロピーをガイド消失度の指標として導入し、エントロピーを考慮したスケーリング手法を提案することで、条件付き意味情報のガイドを適応的に回復する。学習段階では、ノイズデータに対する過剰な確信度予測を緩和するため、エントロピーを考慮した最適化目的関数を提案する。ImageNet1000(256×256)における実験では、提案するサンプリングスキームと訓練済み分類器を用いることで、事前学習済みの条件付きおよび無条件DDPMモデルが、それぞれFIDスコアで4.59から4.09へ10.89%の改善、および12から6.78へ43.5%の改善を達成した。コードは以下のURLで公開されている:https://github.com/ZGCTroy/ED-DPM。

エントロピー駆動型サンプリングおよび条件付き拡散生成のための訓練スキーム | 最新論文 | HyperAI超神経