17日前
ソフトディフュージョン:一般的なノイズに対するスコアマッチング
Giannis Daras, Mauricio Delbracio, Hossein Talebi, Alexandros G. Dimakis, Peyman Milanfar

要約
我々は、従来知られていた拡散モデルを一般化する広義の汚損プロセスの族を定義する。これらの一般化された拡散プロセスを逆転するため、任意の線形汚損プロセスに対してスコア関数を確実に学習できる新しい目的関数「ソフトスコアマッチング(Soft Score Matching)」を提案する。この手法はCelebAにおいて最先端の性能を達成しており、ネットワーク内に汚損プロセスを組み込むことで、汚損後の画像が観測された拡散画像と一致するようなクリーン画像を予測するようにモデルを学習させる。我々は、適切な正則性条件下において、この目的関数が汚損プロセス族の尤度の勾配を学習することを示す。さらに、一般化された拡散プロセスに対して汚損レベルを体系的に選択する方法と、新たに提案する「モーメンタムサンプラー(Momentum Sampler)」と呼ばれる新たなサンプリング手法を開発した。実験的に、本フレームワークがガウシアンブラー、マスキングなど一般的な線形汚損プロセスに対して有効であることを確認した。CelebA-64においてFIDスコア1.85を達成し、これまでのすべての線形拡散モデルを上回る性能を示した。また、従来のノイズ除去拡散モデルと比較して顕著な計算上の利点も示した。