HyperAIHyperAI

Command Palette

Search for a command to run...

Kiss3DGen: إطار عمل لتوليد الأصول ثلاثية الأبعاد يعتمد على نموذج انتشار الصور

An error occurred in the Server Components render. The specific message is omitted in production builds to avoid leaking sensitive details. A digest property is included on this error instance which may provide additional details about the nature of the error.

Failed to load notebook details

1. مقدمة البرنامج التعليمي

نجوم جيثب

Kiss3DGen هو إطار عمل مفتوح المصدر لإنشاء وإعادة بناء ثلاثي الأبعاد، طوّره فريق EnVision-Research ونُشر في مارس 2025. يهدف إلى نقل نماذج الانتشار ثنائية الأبعاد المدربة مسبقًا بكفاءة إلى مهام إنشاء المحتوى ثلاثي الأبعاد. يدعم هذا الإطار عرضًا متعدد المناظر عالي الجودة، وإنشاء نصوص ثلاثية الأبعاد، وتحويل الصور إلى ثلاثية الأبعاد، وإعادة بناء الشبكات ثلاثية الأبعاد، مُدمجًا وحدات متقدمة مثل Flux وMultiview وCaption وReconstruction وLLM. كما يُقدّم تقنية 3D Bundle Image المُدمجة مع خرائط التظليل ومعلومات النسيج لتحقيق إعادة بناء هندسية دقيقة. علاوة على ذلك، يُمكن استخدامه مع أدوات مثل ControlNet لتحسين النماذج ثلاثية الأبعاد وتحريرها. يتميز إطار العمل مفتوح المصدر هذا بسهولة النشر، وله قيمة بحثية وتطبيقية عملية. تتوفر أوراق بحثية ذات صلة. Kiss3DGen: إعادة استخدام نماذج انتشار الصور لإنشاء أصول ثلاثية الأبعادتم إدراجه في مؤتمر CVPR 2025.

يستخدم هذا الشرح إعدادًا ثنائيًا لبطاقة رسومات RTX a6000. تتوفر تعليمات المشروع باللغة الإنجليزية فقط.

2. أمثلة المشاريع

تحويل النص إلى ثلاثي الأبعاد 

تحويل الصورة إلى ثلاثي الأبعاد 

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة تتراوح بين 5 و7 دقائق ثم تحديث الصفحة.

تحويل النص إلى ثلاثي الأبعاد 

تحويل الصورة إلى ثلاثي الأبعاد

ملاحظة: في حال واجهت خطأً، يُرجى استخدام صورة أصغر حجماً. نوصي باستخدام صورة بحجم أقل من 3 ميجابايت.

وصف المعلمة

  • قوة إعادة التحسين: تتحكم في مدى إعادة رسم/تحسين الصورة المُنشأة. تؤدي القيمة الأعلى إلى تعديلات أكبر وتغييرات أكثر في تفاصيل الصورة الأصلية؛ بينما تحافظ القيمة الأقل على المزيد من التفاصيل والبنية الأصلية. نطاق القيمة: 0-1.
  • قوة إزالة التشويش: تتحكم في درجة تقليل التشويش أثناء عملية الإنشاء. القيم الأعلى (الأقرب إلى 1) تُنتج صورة أقرب إلى الصورة الأصلية ولكن مع تباين أكبر؛ بينما القيم الأقل تُنتج صورة أقرب إلى الصورة الأصلية. نطاق القيم: 0-1.
  • تفعيل Redux: عند التفعيل، سيتم إجراء إعادة رسم محسّنة بناءً على قوة Redux تلقائيًا بعد إنشاء الصورة لتحسين جودة الصورة وتفاصيلها.
  • تمكين ControlNet: عند التمكين، يُسمح باستخدام ControlNet أثناء عملية الإنشاء للقيود الهيكلية أو قيود الميزات (مثل الرسومات المرجعية، وخرائط الحواف، وخرائط العمق، وما إلى ذلك)، بحيث يمكن للصورة التي تم إنشاؤها أن تلبي متطلبات هيكلية محددة مع الحفاظ على أسلوبها.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{lin2025kiss3dgen,
  title={Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation},
  author={Lin, Jiantao and Yang, Xin and Chen, Meixi and Xu, Yingjie and Yan, Dongyu and Wu, Leyi and Xu, Xinli and Xu, Lie and Zhang, Shunsi and Chen, Ying-Cong},
  journal={arXiv preprint arXiv:2503.01370},
  year={2025}
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp