MuseV
これは、2024 年 3 月に Tencent Music Entertainment の Tianqin Lab によってオープンソース化されたバーチャル ヒューマン ビデオ生成フレームワークです。高品質のバーチャル ヒューマン ビデオとリップ シンクの生成に焦点を当てています。高度なアルゴリズムを利用して、高度な一貫性と自然な表現を備えた長編ビデオ コンテンツを生成します。公開されているものと組み合わせることができます ミューズトーク 組み合わせて使用すると、完全な「仮想ヒューマン ソリューション」を構築できます。
このモデルには次のような特徴があります。
Stable Diffusion
テキストと画像の生成エコシステムを含む base_model
、 lora
、 controlnet
待って。IPAdapter
、 ReferenceOnly
、 ReferenceNet
、 IPAdapterFaceID
。結果を生成するすべてのフレームは、によって直接生成されます。 MuseV
時間的超解像や空間的超解像などの後処理を一切行わずに生成されます。
このチュートリアルでは、次のすべてのテスト ケースを実装できます。テスト後、7 秒のビデオを生成するのに約 2 分半かかります。テストされた最長のビデオは 20 秒で 8 分かかります。
画像 | ビデオ | プロンプト |
(傑作、最高品質、高解像度:1)、静かな美しい海の風景 | ||
(傑作、最高品質、ハイレゾ:1)、ギターの演奏 | ||
(傑作、最高品質、ハイレゾ:1)、ギターの演奏 |
画像 | ビデオ | プロンプト |
(傑作、最高品質、高解像度:1)、静かな美しい滝、終わりのない滝 | ||
(傑作、最高品質、高解像度:1)、静かな美しい海の風景 |
画像 | ビデオ | プロンプト |
(傑作、最高品質、ハイレゾ:1)、踊っている、アニメーション |
❗注意❗ モデルのサイズが大きいため、コンテナが正常に起動された後、API アドレスを開く前にモデルがロードされるのを待つのに約 1 分かかる場合があります。
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。