HyperAIHyperAI

Command Palette

Search for a command to run...

TransPixeler: RGBAビデオのテキスト生成

Date

8ヶ月前

Size

516.56 MB

License

Other

Paper URL

2501.03006

1. チュートリアルの概要

建てる

香港中文大学、香港科技大学、Adobe Researchが2025年に発表したテキストから動画を生成する手法「TransPixeler」は、従来のRGBモデルの利点を維持しながら、限られた学習データでRGBチャンネルとアルファチャンネル間の強力な整合性を実現します。多様性がありながらも一貫性のあるRGBA動画を効果的に生成できるため、視覚効果やインタラクティブコンテンツ制作の可能性を広げます。関連研究論文もご覧いただけます。 TransPixeler: 透明性を備えたテキストからビデオへの生成の進化それはそうだった CVPR 2025 受け入れる。

このチュートリアルではシングルカード A6000 リソースが使用され、テキストの説明は現在英語のみをサポートしています。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。

2. Web ページに入ると、モデルと会話を開始できます。

パラメータの説明:

  • シード:  生成プロセスのランダム性を制御するために使用される乱数シード。同じシード値では同じ結果が生成されます (他のパラメータが同じである場合)。これは、結果を再現する上で非常に重要です。

利用手順

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

Githubユーザーに感謝 xxxjjjyyy1  このチュートリアルの展開。このプロジェクトの引用情報は次のとおりです。

@misc{wang2025transpixeler,
      title={TransPixeler: Advancing Text-to-Video Generation with Transparency}, 
      author={Luozhou Wang and Yijun Li and Zhifei Chen and Jui-Hsien Wang and Zhifei Zhang and He Zhang and Zhe Lin and Ying-Cong Chen},
      year={2025},
      eprint={2501.03006},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2501.03006}, 
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています