近年、拡散モデルはヴィンセント画像タスクで広く使用されていますが、高品質の画像生成を達成するプロセスでは、通常、ノイズ除去のための複数段階の推論が必要であり、明らかにコンピューティング リソースのコストが大幅に増加します。
これに応えて、研究者らは蒸留アルゴリズムを導入し、拡散モデルの推論プロセスを加速するために拡散を意識した蒸留アルゴリズムを立ち上げました。現在一般的に用いられている方法は、軌道保存蒸留と軌道再構築蒸留に大別される。ただし、重大なパフォーマンスの低下とドメインの逸脱が発生します。
この目的を達成するために、ByteDance は、長所を活用し、短所を回避する Hyper-SD と呼ばれる革新的なフレームワークを提案しました。これは、軌道セグメンテーションの一貫性蒸留により、ほぼ損失のないパフォーマンスを維持しながら、ノイズ除去ステップの数を圧縮する、上記の 2 つの方法の利点を組み合わせたものです。 Trajectory) Segmented Consistency Distillation (TSCD) テクノロジーにより、高速かつ高品質の画像生成が可能になります。
広範な実験とユーザー調査により、Hyper-SD は SDXL アーキテクチャと SD1.5 アーキテクチャの両方で 1 ~ 8 ステップで SOTA レベルの画像生成パフォーマンスを達成できることが示されています。
HyperAI スーパーニューラルチュートリアルセクションに「Hyper-SD リアルタイム描画」を開始しました。コマンドを入力する必要はなく、ワンクリックでクローン作成を開始できます。
チュートリアルのアドレス:
デモの実行
2. ページがジャンプしたら、右上隅の「クローン」をクリックしてチュートリアルを独自のコンテナにクローンします。
3. 右下隅の「次へ: コンピューティング能力の選択」をクリックします。
4. ページがジャンプしたら、「NVIDIA RTX 4090」と「PyTorch」のイメージを選択し、「次へ: レビュー」をクリックします。以下の招待リンクを使用してサインアップした新規ユーザーは、4 時間の RTX 4090 + 5 時間の CPU を無料で入手できます。
HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーして開きます):
https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej
5. すべてが正しいことを確認したら、「続行」をクリックし、最初のクローンが割り当てられるまで待ちます。ステータスが「実行中」に変わったら、「API アドレス」の横にあるジャンプ矢印をクリックしてデモ ページにジャンプします。APIアドレスアクセス機能を利用するには実名認証が必要となりますのでご注意ください。
エフェクトのプレビュー
2. 引き続きさまざまなストロークを追加すると、新しいストロークに基づいてさまざまな画像がリアルタイムで置き換えられることがわかります。