2ヶ月前

PFGM++: 物理学に着想を得た生成モデルの可能性を解き放つ

Yilun Xu; Ziming Liu; Yonglong Tian; Shangyuan Tong; Max Tegmark; Tommi Jaakkola
PFGM++: 物理学に着想を得た生成モデルの可能性を解き放つ
要約

新しい物理学に着想を得た生成モデルのファミリー、PFGM++(Physics-Inspired Generative Models++)を導入します。このモデルは、拡散モデルとポアソンフロー生成モデル(Poisson Flow Generative Models: PFGM)を統一します。これらのモデルは、$N$次元データの生成軌道を$N{+}D$次元空間に埋め込みながら、進行を追加変数$D$の単純なスカラー規範で制御します。新モデルは$D{=}1$のときPFGMに、$D{\to}\infty$のとき拡散モデルに還元されます。$D$を選択する柔軟性により、堅固さと堅実性のトレードオフが可能となり、$D$を増やすことでデータと追加変数規範間の結合がより集中します。PFGMで使用されていた偏った大バッチフィールドターゲットを廃止し、代わりに拡散モデルと同様の無偏倚な摂動ベースの目的関数を提供します。異なる$D$の選択肢を探るため、拡散モデル($D{\to}\infty$)から任意の有限な$D$値への最適化されたハイパーパラメータの直接転送方法を提案します。実験結果では、CIFAR-10/FFHQ $64{\times}64$データセットにおいて、有限な$D$を持つモデルが以前の最先端の拡散モデルよりも優れていることが示されました。具体的には、$D{=}2048/128$の場合、FIDスコアがそれぞれ1.91/2.43となっています。クラス条件付き設定では、CIFAR-10において現在の最先端FIDスコアである1.74が得られました($D{=}2048$)。さらに、小さな$D$を持つモデルがモデリングエラーに対する堅牢性が向上することも示しました。コードはhttps://github.com/Newbeeer/pfgmpp で利用可能です。

PFGM++: 物理学に着想を得た生成モデルの可能性を解き放つ | 最新論文 | HyperAI超神経