Command Palette
Search for a command to run...
PFGM++: 物理学に着想を得た生成モデルの可能性を解き放つ
PFGM++: 物理学に着想を得た生成モデルの可能性を解き放つ
Yilun Xu; Ziming Liu; Yonglong Tian; Shangyuan Tong; Max Tegmark; Tommi Jaakkola
概要
新しい物理学に着想を得た生成モデルのファミリー、PFGM++(Physics-Inspired Generative Models++)を導入します。このモデルは、拡散モデルとポアソンフロー生成モデル(Poisson Flow Generative Models: PFGM)を統一します。これらのモデルは、N次元データの生成軌道をN+D次元空間に埋め込みながら、進行を追加変数Dの単純なスカラー規範で制御します。新モデルはD=1のときPFGMに、D→∞のとき拡散モデルに還元されます。Dを選択する柔軟性により、堅固さと堅実性のトレードオフが可能となり、Dを増やすことでデータと追加変数規範間の結合がより集中します。PFGMで使用されていた偏った大バッチフィールドターゲットを廃止し、代わりに拡散モデルと同様の無偏倚な摂動ベースの目的関数を提供します。異なるDの選択肢を探るため、拡散モデル(D→∞)から任意の有限なD値への最適化されたハイパーパラメータの直接転送方法を提案します。実験結果では、CIFAR-10/FFHQ 64×64データセットにおいて、有限なDを持つモデルが以前の最先端の拡散モデルよりも優れていることが示されました。具体的には、D=2048/128の場合、FIDスコアがそれぞれ1.91/2.43となっています。クラス条件付き設定では、CIFAR-10において現在の最先端FIDスコアである1.74が得られました(D=2048)。さらに、小さなDを持つモデルがモデリングエラーに対する堅牢性が向上することも示しました。コードはhttps://github.com/Newbeeer/pfgmpp で利用可能です。