EX-4D: 単眼ビデオから自由視点を生成
1. チュートリアルの概要

EX-4Dは、ByteDance傘下のPicoチームが2025年7月3日に発表した新しい4D動画生成フレームワークです。単眼動画入力から、極端な視点で高品質な4D動画を生成できます。このフレームワークは、独自のディープウォータープルーフメッシュ(DW-Mesh)表現に基づいており、可視領域と遮蔽領域を明示的にモデル化することで、極端なカメラポーズ下でも幾何学的な一貫性を確保します。このフレームワークは、シミュレートされた遮蔽マスク戦略を用いて単眼動画に基づく効果的なトレーニングデータを生成し、軽量なLoRAベースの動画拡散アダプターを用いて、物理的に一貫性があり時間的にもコヒーレントな動画を合成します。EX-4Dは、極端な視点において既存の手法よりも大幅に優れた性能を発揮し、4D動画生成のための新たなソリューションを提供します。関連論文の結果は以下です。EX-4D: 深度ウォータータイトメッシュによるエクストリームビューポイント4Dビデオ合成”。
このチュートリアルでは、リソースとして単一の RTX A6000 カードを使用します。
2. プロジェクト例

3. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

パラメータの説明
- カメラ角度:カメラ角度は30°~180°です。角度が大きいほど、視野が広くなります。
- フレーム数: ビデオ フレームの数。
- 推論手順: 推論手順。
- ランダム シード: ランダム シード。
4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@misc{hu2025ex4dextremeviewpoint4d,
title={EX-4D: EXtreme Viewpoint 4D Video Synthesis via Depth Watertight Mesh},
author={Tao Hu and Haoyang Peng and Xiao Liu and Yuewen Ma},
year={2025},
eprint={2506.05554},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2506.05554},
}