HyperAIHyperAI

Command Palette

Search for a command to run...

PFGM++: 物理学に着想を得た生成モデルの可能性を解き放つ

Yilun Xu; Ziming Liu; Yonglong Tian; Shangyuan Tong; Max Tegmark; Tommi Jaakkola

概要

新しい物理学に着想を得た生成モデルのファミリー、PFGM++(Physics-Inspired Generative Models++)を導入します。このモデルは、拡散モデルとポアソンフロー生成モデル(Poisson Flow Generative Models: PFGM)を統一します。これらのモデルは、NNN次元データの生成軌道をN+DN{+}DN+D次元空間に埋め込みながら、進行を追加変数DDDの単純なスカラー規範で制御します。新モデルはD=1D{=}1D=1のときPFGMに、DD{\to}\inftyDのとき拡散モデルに還元されます。DDDを選択する柔軟性により、堅固さと堅実性のトレードオフが可能となり、DDDを増やすことでデータと追加変数規範間の結合がより集中します。PFGMで使用されていた偏った大バッチフィールドターゲットを廃止し、代わりに拡散モデルと同様の無偏倚な摂動ベースの目的関数を提供します。異なるDDDの選択肢を探るため、拡散モデル(DD{\to}\inftyD)から任意の有限なDDD値への最適化されたハイパーパラメータの直接転送方法を提案します。実験結果では、CIFAR-10/FFHQ 64×6464{\times}6464×64データセットにおいて、有限なDDDを持つモデルが以前の最先端の拡散モデルよりも優れていることが示されました。具体的には、D=2048/128D{=}2048/128D=2048/128の場合、FIDスコアがそれぞれ1.91/2.43となっています。クラス条件付き設定では、CIFAR-10において現在の最先端FIDスコアである1.74が得られました(D=2048D{=}2048D=2048)。さらに、小さなDDDを持つモデルがモデリングエラーに対する堅牢性が向上することも示しました。コードはhttps://github.com/Newbeeer/pfgmpp で利用可能です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています