このNotebookを実行 Discordで議論

日付

1年前

タグ

論文URL

ライセンス

其他

GitHub

Stability-AI/stable-virtual-camera

GPUコンピュートの無料配布

RTX 5090のコンピュートリソースがわずか20時間分 $1 (価値 $7)

今すぐ受け取る

1. チュートリアルの概要

このチュートリアルで使用されるコンピューティングリソースは、単一の RTX 4090 カードです。

Stable Virtual Camera（Seva）は、Stability AIが2025年3月に発表した汎用普及モデルです。関連する研究論文は以下の通りです。安定した仮想カメラ: 拡散モデルによる生成ビュー合成

Seva は、任意の数の入力ビューとターゲットカメラを指定して、シーンの新しいビューを生成できます。その設計は、特定のタスク構成に依存せずに、視点の変化が大きいサンプルや時間的に滑らかなサンプルを生成する際の既存の方法の制限を克服します。このモデルの注目すべき特徴は、追加の 3D 表現学習を必要とせずに非常に一貫性のあるサンプル生成を維持できるため、実際のアプリケーションでの遠近法合成プロセスが簡素化されることです。さらに、Seva は最長 30 秒の高品質ビデオを生成し、シームレスにループさせることができます。広範なベンチマークテストにより、Seva はさまざまなデータセットと設定で既存の方法よりも優れていることが示されています。

2. 操作手順

1. コンテナを起動します

コンテナを起動した後、APIアドレスをクリックしてWebインターフェースに入ります。モデルが大きいため、WebUIインターフェースが表示されるまでに約3分かかります。そうでない場合は、「Bad Gateway」と表示されます。

2. 基本機能

「基本」インターフェースをクリックします

このインターフェース関数は、単一の画像に基づいて、事前に設定されたカメラ軌跡の 1 つに基づいてビデオを生成できます。

3. 上級

「基本」インターフェースをクリックします

このインターフェースを使用すると、キーフレームベースのインターフェースを通じて任意の数の入力画像を指定して、任意のカメラ軌跡のビデオを生成できます。

画像をアップロードしたら、「確認」をクリックします

「画像を処理」をクリックし、画像が処理されるのを待ちます。

キーフレームを追加するには、「キーフレームの追加」をクリックします。

クリックしてビデオを生成

3. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています