日付

1年前

サイズ

2.64 GB

タグ

3Dモデル

GitHub

tencent/Hunyuan3D-1

論文URL

3d.hunyuan.tencent.com

Tencent Hunyuan3D-1.0: テキストを 3D に、画像を 3D に変換するための統合フレームワーク

1. チュートリアルの概要

Hunyuan3D-1.0は、テンセントの研究チームが2024年にリリースした3D生成拡散モデルです。軽量版と標準版があり、どちらもテキストと画像の入力から高品質の3Dアセットを生成できます。軽量版は約10秒で3Dオブジェクトを生成でき、標準版は約25秒で処理を完了します。標準版は、軽量版や他の既存モデルと比較して3倍のパラメータを備えています。関連技術レポートも入手可能です。 Tencent Hunyuan3D-1.0: Text-to-3D および Image-to-3D 生成のための統合フレームワーク。

このフレームワークにはテキストから画像へのモデルである Hunyuan-DiT が含まれており、Hunyuan3D-1.0 はテキストから 3D (Text-to-3D) および画像から 3D (Image-to) に適用できる統合フレームワークです。 -3D) の生成。このモデルは、3D アセット生成に 2 段階のアプローチを使用します。第 1 段階では、多視点拡散モデルを使用して、多視点 RGB 画像を約 4 秒で効率的に生成します。第 2 段階では、これらのマルチビュー画像を使用してフィードフォワード再構成モデルを導入し、約 3 秒で 3D ビューを迅速かつ正確に再構成します。このモデルは、大きな建物から小さな道具や花に至るまで、さまざまなスケールでオブジェクトを再構築できます。 GSO と OmniObject3D という 2 つのパブリック 3D データセットでのパフォーマンスは、主流のオープンソースモデルよりも優れており、その全体的な機能は国際的にトップクラスのレベルにあります。定性的および定量的な多次元評価の後、Hunyuan3D-1.0 は、幾何学的詳細、テクスチャ詳細、テクスチャとジオメトリの一貫性、3D 合理性、および指示への準拠性の点で非常に優れたパフォーマンスを発揮しました。

Hunyuan3D-1.0 のリリースは、3D クリエーターとアーティストに、3D アセットを自動的に生成する強力なツールを提供し、3D 生成の速度と汎用化機能を向上させます。

このチュートリアルは、Hunyuan3D-1.0 の軽量バージョンであり、Web インターフェイスに 2 つの機能を含めるために 3 つのモデルを使用します。

2 つの機能:

画像生成 3D (image_to_3D)
テキストを 3D に変換 (text_to_3D)

3 つのモデル:

Hunyuan3D-1/lite マルチビュー生成のための合理化されたモデル
Hunyuan3D-1/std マルチビュー生成標準モデル
Hunyuan3D-1/svrm スパースビュー再構築モデル

2. 効果例

3. 操作手順

启动容器后等待约 3 分钟（加载模型），点击 API 地址即可进入 Web 界面（否则将会显示 BadGateway）

1. 画像生成 3D (image_to_3d)

选择「Text to 3D」功能，按如下要求输入提示词和进行相关设置
如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

図 1 画像生成ビデオのデモ

2. テキストを 3D に変換 (image_to_video)

选择「Image to 3D」功能，按如下要求输入提示词和相关设置。
注意：自行上传图像时，请务必保证图片为 n*n 的正方形，否则会出现报错的情况
 如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

図 2 画像生成ビデオのデモ

交流とディスカッション

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

1年前

サイズ

2.64 GB

タグ

3Dモデル

GitHub

tencent/Hunyuan3D-1

論文URL

3d.hunyuan.tencent.com

Tencent Hunyuan3D-1.0: テキストを 3D に、画像を 3D に変換するための統合フレームワーク

1. チュートリアルの概要

このチュートリアルは、Hunyuan3D-1.0 の軽量バージョンであり、Web インターフェイスに 2 つの機能を含めるために 3 つのモデルを使用します。

2 つの機能:

画像生成 3D (image_to_3D)
テキストを 3D に変換 (text_to_3D)

3 つのモデル:

Hunyuan3D-1/lite マルチビュー生成のための合理化されたモデル
Hunyuan3D-1/std マルチビュー生成標準モデル
Hunyuan3D-1/svrm スパースビュー再構築モデル

2. 効果例

3. 操作手順

启动容器后等待约 3 分钟（加载模型），点击 API 地址即可进入 Web 界面（否则将会显示 BadGateway）

1. 画像生成 3D (image_to_3d)

选择「Text to 3D」功能，按如下要求输入提示词和进行相关设置
如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

図 1 画像生成ビデオのデモ

2. テキストを 3D に変換 (image_to_video)

选择「Image to 3D」功能，按如下要求输入提示词和相关设置。
注意：自行上传图像时，请务必保证图片为 n*n 的正方形，否则会出现报错的情况
 如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

図 2 画像生成ビデオのデモ

交流とディスカッション

Krea-realtime-video: リアルタイムビデオ生成モデル

3ヶ月前

SAM3: 視覚セグメンテーションモデル

2ヶ月前

ドクリング: ドキュメント解析アーティファクト

2ヶ月前

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

21日前

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

3ヶ月前

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

2ヶ月前

ROCKET-2: 3Dゲームゼロショット転送

2ヶ月前

Supertonic: ONNXに基づく高速TTS音声合成モデル

2ヶ月前

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Hunyuan3D: わずか 10 秒で 3D アセットを生成

Tencent Hunyuan3D-1.0: テキストを 3D に、画像を 3D に変換するための統合フレームワーク

1. チュートリアルの概要

2. 効果例

3. 操作手順

1. 画像生成 3D (image_to_3d)

2. テキストを 3D に変換 (image_to_video)

交流とディスカッション

AIでAIを構築

HyperAI Newsletters

Command Palette

Hunyuan3D: わずか 10 秒で 3D アセットを生成

Tencent Hunyuan3D-1.0: テキストを 3D に、画像を 3D に変換するための統合フレームワーク

1. チュートリアルの概要

2. 効果例

3. 操作手順

1. 画像生成 3D (image_to_3d)

2. テキストを 3D に変換 (image_to_video)

交流とディスカッション

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

ドクリング: ドキュメント解析アーティファクト

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

ROCKET-2: 3Dゲームゼロショット転送

Supertonic: ONNXに基づく高速TTS音声合成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

AIでAIを構築

HyperAI Newsletters

Command Palette

Hunyuan3D: わずか 10 秒で 3D アセットを生成

Tencent Hunyuan3D-1.0: テキストを 3D に、画像を 3D に変換するための統合フレームワーク

1. チュートリアルの概要

2. 効果例

3. 操作手順

1. 画像生成 3D (image_to_3d)

2. テキストを 3D に変換 (image_to_video)

交流とディスカッション

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

ドクリング: ドキュメント解析アーティファクト

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

ROCKET-2: 3Dゲームゼロショット転送

Supertonic: ONNXに基づく高速TTS音声合成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

ドクリング: ドキュメント解析アーティファクト

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

ROCKET-2: 3Dゲームゼロショット転送

Supertonic: ONNXに基づく高速TTS音声合成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

SAM3: 視覚セグメンテーションモデル

ドクリング: ドキュメント解析アーティファクト

Fara-7B: 非常に効率的なWebベースのインテリジェントエージェントモデル

LongCat-Video: MeituanのオープンソースAIビデオ生成モデル

VibeVoice-Realtime TTS: リアルタイム音声合成サービス

ROCKET-2: 3Dゲームゼロショット転送

Supertonic: ONNXに基づく高速TTS音声合成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

関連ノートブック

関連ノートブック

関連ノートブック

関連ノートブック