Exécuter ce Notebook Discuter sur Discord

Date

il y a un an

Taille

2.64 GB

Balises

Modèle 3D

GitHub

tencent/Hunyuan3D-1

URL du document

3d.hunyuan.tencent.com

Tencent Hunyuan3D-1.0 : un cadre unifié pour la conversion de texte en 3D et d'image en 3D

1. Introduction au tutoriel

Hunyuan3D-1.0 est un modèle de diffusion génératif 3D développé par l'équipe de recherche de Tencent en 2024. Il comprend une version allégée et une version standard, toutes deux permettant de générer des ressources 3D de haute qualité à partir de textes et d'images. La version allégée génère des objets 3D en une dizaine de secondes, tandis que la version standard effectue le processus en une vingtaine de secondes. Cette dernière possède trois fois plus de paramètres que la version allégée et que les autres modèles existants. Des rapports techniques sont disponibles. Tencent Hunyuan3D-1.0 : un cadre unifié pour la génération de texte et d'images 3D .

Le cadre implique un modèle texte-image, à savoir Hunyuan-DiT. Hunyuan3D-1.0 est un framework unifié qui peut être appliqué à la génération de texte en 3D et d'image en 3D. Le modèle adopte une approche en deux étapes pour la génération d’actifs 3D. La première étape utilise un modèle de diffusion multi-vues pour générer efficacement des images RVB multi-vues en environ 4 secondes. La deuxième étape introduit un modèle de reconstruction par anticipation qui utilise ces images multi-vues pour reconstruire rapidement et avec précision la vue 3D en environ 3 secondes. Le modèle est capable de reconstruire des objets de différentes échelles, des grands bâtiments aux petits outils ou plantes. Ses performances sur deux ensembles de données 3D publics - GSO et OmniObject3D - sont meilleures que celles des principaux modèles open source, et ses capacités globales sont au niveau international. Après une évaluation multidimensionnelle qualitative et quantitative, Hunyuan3D-1.0 a obtenu de très bons résultats en termes de détails géométriques, de détails de texture, de cohérence texture-géométrie, de rationalité 3D et de conformité aux instructions.

La sortie de Hunyuan3D-1.0 fournit aux créateurs et artistes 3D un outil puissant capable d'automatiser la production d'actifs 3D et d'améliorer la vitesse et la généralisation de la génération 3D.

Ce tutoriel est une version allégée de Hunyuan3D-1.0. Il utilise 3 modèles pour que l'interface Web inclue 2 fonctions :

Deux fonctions :

Image en 3D (image_to_3D)
Texte en 3D (text_to_3D)

Trois modèles :

Hunyuan3D-1/lite Un modèle compact pour la génération multi-vues
Hunyuan3D-1/std Modèle standard pour la génération multi-vues
Modèle de reconstruction de vue clairsemée Hunyuan3D-1/svrm

2. Exemples d'effets

3. Étapes de l'opération

启动容器后等待约 3 分钟（加载模型），点击 API 地址即可进入 Web 界面（否则将会显示 BadGateway）

1. Image en 3D (image_to_3d)

选择「Text to 3D」功能，按如下要求输入提示词和进行相关设置
如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

Figure 1. Démonstration vidéo de génération d'images

2. Texte en 3D (image_en_vidéo)

选择「Image to 3D」功能，按如下要求输入提示词和相关设置。
注意：自行上传图像时，请务必保证图片为 n*n 的正方形，否则会出现报错的情况
 如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

Figure 2 Démonstration vidéo de génération d'images

Échange et discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

VibeVoice - Synthèse Vocale En Temps Réel : Service De Synthèse Vocale En Temps Réel

il y a 2 mois

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

il y a 2 mois

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a un an

Taille

2.64 GB

Balises

Modèle 3D

GitHub

tencent/Hunyuan3D-1

URL du document

3d.hunyuan.tencent.com

Tencent Hunyuan3D-1.0 : un cadre unifié pour la conversion de texte en 3D et d'image en 3D

1. Introduction au tutoriel

Ce tutoriel est une version allégée de Hunyuan3D-1.0. Il utilise 3 modèles pour que l'interface Web inclue 2 fonctions :

Deux fonctions :

Image en 3D (image_to_3D)
Texte en 3D (text_to_3D)

Trois modèles :

Hunyuan3D-1/lite Un modèle compact pour la génération multi-vues
Hunyuan3D-1/std Modèle standard pour la génération multi-vues
Modèle de reconstruction de vue clairsemée Hunyuan3D-1/svrm

2. Exemples d'effets

3. Étapes de l'opération

启动容器后等待约 3 分钟（加载模型），点击 API 地址即可进入 Web 界面（否则将会显示 BadGateway）

1. Image en 3D (image_to_3d)

选择「Text to 3D」功能，按如下要求输入提示词和进行相关设置
如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

Figure 1. Démonstration vidéo de génération d'images

2. Texte en 3D (image_en_vidéo)

选择「Image to 3D」功能，按如下要求输入提示词和相关设置。
注意：自行上传图像时，请务必保证图片为 n*n 的正方形，否则会出现报错的情况
 如果需要生成 gif 必须选中「Render gif」，否则不会生成效果。其他功能无需选中

Figure 2 Démonstration vidéo de génération d'images

Échange et discussion

Associé Notebooks

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

il y a 9 jours

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

il y a 3 mois

SAM3 : Modèle De Segmentation Visuelle

il y a 2 mois

Doling : Outil d'analyse De Documents

il y a 2 mois

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

il y a 21 jours

LongCat-Video : Le Modèle De Génération Vidéo IA Open Source De Meituan

il y a 3 mois

VibeVoice - Synthèse Vocale En Temps Réel : Service De Synthèse Vocale En Temps Réel

il y a 2 mois

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

il y a 2 mois

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Hunyuan3D : Générez Des Ressources 3D En Seulement 10 Secondes

Tencent Hunyuan3D-1.0 : un cadre unifié pour la conversion de texte en 3D et d'image en 3D

1. Introduction au tutoriel

2. Exemples d'effets

3. Étapes de l'opération

1. Image en 3D (image_to_3d)

2. Texte en 3D (image_en_vidéo)

Échange et discussion

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Hunyuan3D : Générez Des Ressources 3D En Seulement 10 Secondes

Tencent Hunyuan3D-1.0 : un cadre unifié pour la conversion de texte en 3D et d'image en 3D

1. Introduction au tutoriel

2. Exemples d'effets

3. Étapes de l'opération

1. Image en 3D (image_to_3d)

2. Texte en 3D (image_en_vidéo)

Échange et discussion

Associé Notebooks

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

SAM3 : Modèle De Segmentation Visuelle

Doling : Outil d'analyse De Documents

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

LongCat-Video : Le Modèle De Génération Vidéo IA Open Source De Meituan

VibeVoice - Synthèse Vocale En Temps Réel : Service De Synthèse Vocale En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Hunyuan3D : Générez Des Ressources 3D En Seulement 10 Secondes

Tencent Hunyuan3D-1.0 : un cadre unifié pour la conversion de texte en 3D et d'image en 3D

1. Introduction au tutoriel

2. Exemples d'effets

3. Étapes de l'opération

1. Image en 3D (image_to_3d)

2. Texte en 3D (image_en_vidéo)

Échange et discussion

Associé Notebooks

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

SAM3 : Modèle De Segmentation Visuelle

Doling : Outil d'analyse De Documents

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

LongCat-Video : Le Modèle De Génération Vidéo IA Open Source De Meituan

VibeVoice - Synthèse Vocale En Temps Réel : Service De Synthèse Vocale En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

SAM3 : Modèle De Segmentation Visuelle

Doling : Outil d'analyse De Documents

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

LongCat-Video : Le Modèle De Génération Vidéo IA Open Source De Meituan

VibeVoice - Synthèse Vocale En Temps Réel : Service De Synthèse Vocale En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

Associé Notebooks

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

Krea-realtime-video : Modèle De Génération Vidéo En Temps Réel

SAM3 : Modèle De Segmentation Visuelle

Doling : Outil d'analyse De Documents

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

LongCat-Video : Le Modèle De Génération Vidéo IA Open Source De Meituan

VibeVoice - Synthèse Vocale En Temps Réel : Service De Synthèse Vocale En Temps Réel

ROCKET-2 : Transfert Zero-Shot Du Jeu 3D

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX