Command Palette
Search for a command to run...
HunyuanWorld-Mirror: 3D世界生成モデル
1. チュートリアルの概要

HunyuanWorld-Mirrorは、テンセントのHunyuanチームが2025年10月にリリースしたオープンソースの3D世界生成モデルです。マルチビュー画像や動画を含む複数の入力方法をサポートし、点群、深度マップ、カメラパラメータなど、様々な3D幾何学的予測結果を出力できます。このモデルは純粋なフィードフォワードアーキテクチャを採用し、単一のGPUにデプロイ可能で、8~32ビューの入力をローカルで処理することで第2レベルの推論を実現します。その技術アーキテクチャには、マルチモーダル事前ヒント、汎用幾何学的予測アーキテクチャ、カリキュラム学習戦略が含まれています。動的な事前注入メカニズムにより、モデルはあらゆる事前情報の組み合わせに柔軟に適応できます。トレーニング中は、タスク順序、データスケジューリング、プログレッシブ解像度に基づくカリキュラム学習戦略を採用し、汎化能力を最大化します。HunyuanWorld-Mirrorは、3D点群再構成とエンドツーエンドの3DGS再構成において優れた性能を発揮し、卓越した幾何学的精度とディテール復元能力を発揮します。関連研究論文は[関連論文へのリンク]でご覧いただけます。WorldMirror: 事前プロンプトによるユニバーサル 3D ワールド再構築”。
このチュートリアルでは、デフォルトのリソースとして単一の RTX 5090 グラフィック カードを使用しますが、プログラムの起動には、最小で単一の RTX 4090 グラフィック カードも使用できます。
2. エフェクト表示

3. 操作手順
1. コンテナを起動します

2. 使用手順
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。 最初の再構築には約 2 分かかり、データの読み込みと 3D 効果の表示には時間がかかる場合があります。

パラメータオプション:
- ビデオ サンプル間隔: ビデオ サンプリングの間隔。
- 再構築オプション (3DGS には適用されません):
- カメラを表示: カメラを表示するかどうか。
- メッシュを表示: メッシュを表示するかどうか。
- 低い信頼度と深度/通常のエッジをフィルタリング: 低い信頼度と深度/通常のエッジをフィルタリングするかどうか。
- 空の背景をフィルタリング: 空の背景をフィルタリングするかどうか。
- 3D ガウス スプラッティング: RGB と深度ビデオを使用したインタラクティブな 3D ガウス スパッタリング視覚化 (PLY としてダウンロード可能)。
- ポイント クラウド/メッシュ: ポイント クラウド。
- 深度マップ: 単一ビューの深度推定結果 (PNG 形式でダウンロード可能)。
- 法線マップ: ビューごとのサーフェスの向きの視覚化 (PNG としてダウンロード可能)。
- カメラ パラメーター: 推定されたカメラのポーズと固有パラメーター (JSON としてダウンロード可能)。
4. 議論
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
このプロジェクトの引用情報は次のとおりです。
@article{liu2025worldmirror,
title={WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting},
author={Liu, Yifan and Min, Zhiyuan and Wang, Zhenwei and Wu, Junta and Wang, Tengfei and Yuan, Yixuan and Luo, Yawei and Guo, Chunchao},
journal={arXiv preprint arXiv:2510.10726},
year={2025}
}