LGM の大規模マルチビュー ガウス モデル生成デモ
大規模なマルチビュー ガウス モデル

このチュートリアルは、LGM のデモ実装です。 LGM (Large Multi-View Gaussian Model) は、テキスト プロンプトまたはシングルビュー画像から高解像度 3D モデルを生成するための革新的なフレームワークです。論文では「LGM: 高解像度 3D コンテンツ作成のための大規模マルチビュー ガウス モデル』で提案されました。 LGM フレームワークは、3D 表現としてマルチビュー ガウス特徴を使用し、バックボーン ネットワークとして非対称 U-Net を使用することにより、高忠実度で効率的な 3D モデル生成を実現します。この方法では 5 秒で 3D オブジェクトを生成でき、トレーニング解像度を 512 に高めることで、高解像度の 3D コンテンツの生成を実現します。
エフェクト表示
ステップの実行
1. チュートリアル コンテナを複製して正常に起動したら、次の手順に従って操作ページに移動します。

2. 写真をアップロード/プロンプトワードを入力/両方を混合して 3D 表示効果を生成します。

交流とディスカッション
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。