HyperAI超神経

Hunyuan3D-2.1: 物理レンダリングテクスチャをサポートする3D生成モデル

1. チュートリアルの概要

建てる

Tencent Hunyuan3D-2.1は、Tencent Hunyuanチームが2025年6月14日にリリースした産業グレードのオープンソース3D生成モデルです。スケーラブルな3Dアセット作成システムであり、完全にオープンソース化されたフレームワークと物理ベースレンダリング(PBR)テクスチャ合成という2つの主要なイノベーションを通じて、最先端の3D生成技術の開発を促進します。物理ベースレンダリングをサポートする初のマテリアル生成モデルであり、拡散反射、金属性、法線マップなどの物理法則に基づく完全なマテリアルシステムにより、革やブロンズなどのマテリアルにおける映画レベルの光と影の相互作用を実現し、ゲームアセットや工業デザインなどの制作レベルの精度要件を満たします。同時に、データ処理、トレーニング推論コード、モデルの重み、アーキテクチャは完全にオープン化されており、コミュニティ開発者が下流タスクを微調整し、学術研究に再現可能なベースラインを提供し、産業実装のための反復開発コストを削減することをサポートします。関連する論文結果は「Hunyuan3D 2.0: 高解像度テクスチャ付き 3D アセット生成のための拡散モデルのスケーリング」がCVPR2025に採択されました。

このチュートリアルで使用されるコンピューティング リソースは、単一の RTX A6000 カードです。

2. エフェクト表示

3. 操作手順

1. コンテナを起動します

2. 使用手順

「Bad Gateway」と表示される場合は、モデルが初期化中です。モデルのサイズが大きいため、3~4分ほどお待ちいただき、ページを更新してください。

具体的なパラメータ:

  • ターゲット面数: 3D モデルを生成する三角形面の最大数を指定します。
  • 背景を削除: 背景を削除し、画像の背景 (単色、雑然としたシーンなど) を自動的に検出してクリアし、メインオブジェクトのアウトラインのみを保持するかどうかを指定します。
  • シード: 生成プロセスのランダム性を制御します。
  • 推論ステップ: 拡散モデルのサンプリング反復回数を制御します。
  • オクツリー解像度: 3D 空間セグメンテーションのグリッド精度レベルを定義します。
  • ガイダンス スケール: 生成された結果に対してテキストの説明によって課される制約の強度を制御します。
  • チャンクの数: 大規模な 3D レンダリング タスクを、並列処理されるサブチャンクに分割して、ビデオ メモリ オーバーフロー (OOM) を回避します。

結果

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

このプロジェクトの引用情報は次のとおりです。

@misc{hunyuan3d22025tencent,
    title={Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation},
    author={Tencent Hunyuan3D Team},
    year={2025},
    eprint={2501.12202},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}

@misc{yang2024hunyuan3d,
title={Hunyuan3D 1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation},
author={Tencent Hunyuan3D Team},
year={2024},
eprint={2411.02293},
archivePrefix={arXiv},
primaryClass={cs.CV}
}