HyperAI

Hunyuan3D: إنشاء أصول ثلاثية الأبعاد في 10 ثوانٍ فقط

Tencent Hunyuan3D-1.0: إطار عمل موحد لتحويل النصوص إلى صور ثلاثية الأبعاد والصور إلى صور ثلاثية الأبعاد

1. مقدمة البرنامج التعليمي

Hunyuan3D-1.0 هو نموذج انتشار توليدي ثلاثي الأبعاد أطلقه فريق البحث في Tencent في عام 2024. ويتضمن إصدارًا خفيف الوزن وإصدارًا قياسيًا، وكلاهما يدعم إنشاء أصول ثلاثية الأبعاد عالية الجودة من مدخلات النصوص والصور. يمكن للإصدار خفيف الوزن إنشاء كائنات ثلاثية الأبعاد في حوالي 10 ثوانٍ، بينما يمكن إكمال الإصدار القياسي في حوالي 25 ثانية. تحتوي النسخة القياسية على معلمات أكثر بثلاث مرات من النسخة المبسطة والنماذج الأخرى الموجودة. التقرير الفني ذو الصلة هوTencent Hunyuan3D-1.0: إطار عمل موحد لإنشاء النصوص ثلاثية الأبعاد والصور ثلاثية الأبعاد".

يتضمن الإطار نموذج تحويل النص إلى صورة، وهو Hunyuan-DiT. Hunyuan3D-1.0 هو إطار عمل موحد يمكن تطبيقه على إنشاء النصوص ثلاثية الأبعاد وإنشاء الصور ثلاثية الأبعاد. يعتمد النموذج على نهج مكون من مرحلتين لتوليد الأصول ثلاثية الأبعاد. تستخدم المرحلة الأولى نموذج انتشار متعدد العرض لتوليد صور RGB متعددة العرض بكفاءة في حوالي 4 ثوانٍ. تقدم المرحلة الثانية نموذج إعادة بناء التغذية الأمامية الذي يستخدم هذه الصور متعددة العرض لإعادة بناء العرض ثلاثي الأبعاد بسرعة ودقة في حوالي 3 ثوانٍ. يتمكن النموذج من إعادة بناء أشياء ذات مقاييس مختلفة، من المباني الكبيرة إلى الأدوات أو النباتات الصغيرة. إن أداءه على مجموعتين عامتين من البيانات ثلاثية الأبعاد - GSO وOmniObject3D - أفضل من أداء نماذج المصدر المفتوح السائدة، وقدراته الشاملة على المستوى الرائد دوليًا. بعد التقييم متعدد الأبعاد النوعي والكمي، أظهر Hunyuan3D-1.0 أداءً جيدًا للغاية من حيث التفاصيل الهندسية، وتفاصيل الملمس، وتناسق الملمس والهندسة، والعقلانية ثلاثية الأبعاد، والامتثال للتعليمات.

يوفر إصدار Hunyuan3D-1.0 لمنشئي وفناني ثلاثي الأبعاد أداة قوية يمكنها أتمتة إنتاج الأصول ثلاثية الأبعاد وتحسين سرعة وتعميم إنشاء ثلاثي الأبعاد.

يعد هذا البرنامج التعليمي نسخة خفيفة الوزن من Hunyuan3D-1.0. يستخدم 3 نماذج لجعل واجهة الويب تتضمن وظيفتين:

وظيفتين:

  • تحويل الصورة إلى ثلاثية الأبعاد (image_to_3D)
  • تحويل النص إلى ثلاثي الأبعاد (text_to_3D)

ثلاثة نماذج:

  • Hunyuan3D-1/lite نموذج مضغوط لتوليد متعدد المشاهد
  • Hunyuan3D-1/std نموذج قياسي لتوليد متعدد المشاهد
  • نموذج إعادة بناء عرض متفرق Hunyuan3D-1/svrm

2. أمثلة على التأثيرات

3. خطوات التشغيل

启动容器后等待约 3 分钟(加载模型),点击 API 地址即可进入 Web 界面(否则将会显示 BadGateway)

1. تحويل الصورة إلى ثلاثية الأبعاد (image_to_3d)

选择「Text to 3D」功能,按如下要求输入提示词和进行相关设置
如果需要生成 gif 必须选中「Render gif」,否则不会生成效果。其他功能无需选中

الشكل 1. فيديو توضيحي لتوليد الصور

2. تحويل النص إلى ثلاثي الأبعاد (الصورة إلى الفيديو)

选择「Image to 3D」功能,按如下要求输入提示词和相关设置。
注意:自行上传图像时,请务必保证图片为 n*n 的正方形,否则会出现报错的情况
 如果需要生成 gif 必须选中「Render gif」,否则不会生成效果。其他功能无需选中

الشكل 2 فيديو توضيحي لتوليد الصور

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓