HyperAIHyperAI

Command Palette

Search for a command to run...

トレイサテッド コンシステンシー モデル

Sangyun Lee Yilun Xu Tomas Geffner Giulia Fanti Karsten Kreis Arash Vahdat Weili Nie

概要

最近、確率フロー常微分方程式(PF ODE)の解(すなわちデータ)を初期ノイズから直接予測することで、拡散モデルからのサンプリングを高速化するための一貫性モデル(consistency models)が提案された。しかし、一貫性モデルの学習では、PF ODEの軌道上のすべての中間点をその対応する終点に写像する能力を学習する必要がある。これは、最終的な目的である1ステップ生成(ノイズからデータへの写像)よりもはるかに困難なタスクである。我々は実験的にこの学習枠組みが、一貫性モデルの1ステップ生成性能を制限していることを明らかにした。この問題に対処するため、我々は時間範囲を切り詰めた(truncated time range)一貫性学習に一般化した。これにより、モデルは初期の時間ステップにおけるノイズ除去タスクを無視し、生成性能に注力できるようになる。さらに、一貫性関数の新たなパラメータ化と、切り詰め時間範囲での学習が自明な解に収束するのを防ぐための2段階学習プロシージャを提案する。CIFAR-10およびImageNet 64×6464\times6464×64 データセットにおける実験結果から、本手法はiCT-deepを含む最先端の一貫性モデルよりも、1ステップおよび2ステップのFIDスコアをより良好に達成でき、ネットワークサイズを2倍以上小さくしても高い性能を発揮することが示された。プロジェクトページ:https://truncated-cm.github.io/


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています