2024 年 2 月、Sora が再び注目を集め、60 秒の表示ビデオによって再び熱い議論が巻き起こり、多くの人がその画像を無視するようになりました。 。
さらに注目に値するのは、実際、Sora がリリースされる少し前に、Stability AI が AI 描画ツール Stable Cascade をオープンソース化していたことです。この同様に強力なツールも、ある程度は Sora に「奪われ」ました。
Stability AI の公式導入によると、Stable Diffusion 1.5 と比較して、Stable Cascade はコストを 16 倍削減できます。異なるモデルの性能評価比較では、このモデルは瞬時の位置合わせと美的品質の点で他のモデルと同等以上の性能を発揮しました。
新世代の Vincent ダイアグラム モデルとして、Stable Cascade は Würstchen アーキテクチャに基づいて構築されており、3 つのステージで構成されています。
ステージ A は VAE モデル、ステージ B とステージ C は拡散モデルです。プロンプトワードを入力すると、ステージ C モデルはテキストに基づいて 24*24 の低解像度の潜像を生成し、それをステージ B モデルに入力して拡大し、次にステージ A モデルに入力して再度拡大します。それをピクセル空間に変換し、最終的に画像を生成します。
この段階的なアーキテクチャ パターンにより、イメージ生成時に Stable Cascade がより柔軟かつ効率的になります。一方で、各段階で異なるサイズのモデルを使用することで、ユーザーは自分のハードウェア条件に応じて適切なモデルを選択できるようになり、ハードウェア要件が軽減されます。一方、さまざまな段階のモデルを個別にトレーニングまたは微調整することができるため、モデルがさまざまなタスクやニーズに適切に適応できるようになります。
ヴィンセントの写真に加えて、Stable Cascade は、画像変換と画像間の生成も実行します。、この機能は非常に強力です。現在、ComfyUI は Stable Cascade の使用を正式にサポートしており、ワークフローを構築することで、数秒で画像を生成できます。ただし、ユーザーが ComfyUI Stable Cascade を実行すると、ノードのドラッグと接続には多くの時間がかかり、接続エラーが発生した場合、技術者以外が迅速に修正して調整することは困難です。
最近、人気のアップ ステーション B の主要な独立研究者である Xingkong が、「ComfyUI Stable Cascade Workflow Online Tutorial」を Super Neural 公式 Web サイトでオンラインで公開しました。。このチュートリアルは、適切な環境をセットアップするのに役立ちます。また、Stable Cascade のデフォルトの Vincent ダイアグラム ワークフローも組み込まれており、ノードの接続に直接役立ち、使用プロセスを簡素化し、2 秒でダイアグラムを作成できます。
スーパーニューラル公開チュートリアルのアドレス:
https://hyper.ai/tutorials/30620
Station B up の主な独立研究者である Xingkong 氏の教育ビデオは次のとおりです。
チュートリアルによると、エディターはさまざまなスタイルで美しい写真を生成することに成功しました。ぜひ試してみてください。
デモの実行
2. 「このチュートリアルをオンラインで実行する」をクリックします。ページが移動したら、「クローン」をクリックします。
3. 右下隅の「次へ: コンピューティング能力の選択」をクリックします。
4. ジャンプ後、「NVIDIA GeForce RTX 4090」を選択し、「次へ: 確認」をクリックします。新規ユーザーは、以下の招待リンクを使用して登録すると、4 時間の RTX 4090 + 5 時間の無料 CPU コンピューティング時間を取得できます。
HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーし、開いて登録します):
https://openbayes.com/console/signup?r=Ada0322_QZy7
5. [続行] をクリックし、リソースが割り当てられるまで待ちます。最初のクローンには約 2 分かかります。ステータスが「実行中」に変わったら、「ワークスペースを開く」をクリックします。
5 分以上「リソースを割り当てています」状態が続く場合は、コンテナを停止して再起動してみてください。再起動しても問題が解決しない場合は、公式 Web サイトのプラットフォーム カスタマー サービスにお問い合わせください。
6. ワークスペースを開いた後、起動ページで新しいターミナル セッションを作成し、コマンド ラインに「./run.sh」と入力します。
7. コマンド ラインに「GUI を参照するには、http://0.0.0.0:8080」と表示されたら、右側の API アドレスをブラウザのアドレス バーにコピーして、ComfyUI インターフェイスにアクセスします。APIアドレスアクセス機能を利用するには実名認証が必要となりますのでご注意ください。
エフェクト表示
2. CLIP テキスト エンコーダーに英語のプロンプト ワードを入力し、[プロンプト ワード キューを追加] をクリックすると、わずか 2 秒で画像がすばやく生成されます。
3. 画像生成、画像バリエーション、複数画像混合、ネットワーク制御のワークフローをロードしたい場合は、公式 ComfyUI Stable Cascade ページからさらに多くのワークフローをダウンロードできます。
その他の安定したカスケード ワークフローのリンク:
https://comfyanonymous.github.io/ComfyUI_examples/stable_cascade
上記のリンクをクリックした後、ページ上の対応する画像を右クリックして保存し、OpenBayes プラットフォームの ComfyUI インターフェイスに戻り、保存した画像をそこにドラッグして他のワークフローを読み込みます。
現在、HyperAI 公式 Web サイトでは、Jupyter Notebook にまとめられた数百の厳選された機械学習関連のチュートリアルを公開しています。
リンクをクリックして、関連するチュートリアルとデータ セットを検索します。
以上が今回編集者が共有した内容ですので、ご参考になれば幸いです。他の楽しいチュートリアルを学びたい場合は、メッセージまたはプライベート メッセージを残してプロジェクトのアドレスをお知らせください。編集者が AI の遊び方を教えるコースをカスタマイズします。 (追記:前回友人から依頼されたSUPIR-AI写真復元プロジェクトはすでに準備中です。)
参考文献:
1.https://zhuanlan.zhihu.com/p/683276860
2.https://m.ithome.com/html/750418.htm
3.https://stability.ai/news/introducing-stable-cascade
4.https://www.aigc.cc/archives/sdsd.html
5.https://zhuanlan.zhihu.com/p/682460863
6.https://www.aihub.cn/tools/image/stablecascade/
7.https://zhuanlan.zhihu.com/p/683832139