Command Palette
Search for a command to run...
Kiss3DGen: إعادة توظيف نماذج التمايز الصورية لإنشاء الأصول ثلاثية الأبعاد
Kiss3DGen: إعادة توظيف نماذج التمايز الصورية لإنشاء الأصول ثلاثية الأبعاد
Jiantao Lin Xin Yang Meixi Chen Yingjie Xu Dongyu Yan Leyi Wu Xinli Xu Lie XU Shunsi Zhang Ying-Cong Chen
الملخص
حققت نماذج الانتشار نجاحًا كبيرًا في إنتاج الصور ثنائية الأبعاد. ومع ذلك، ما زالت جودة وإمكانية التعميم في إنتاج المحتوى ثلاثي الأبعاد محدودة. وغالبًا ما تتطلب الطرق الرائدة حُزمًا ضخمة من المحتوى ثلاثي الأبعاد لتدريب النموذج، وهي مصادر صعبة الجمع. في هذا العمل، نقدّم إطار عمل يُسمّى "Kiss3DGen" (ابقَ بسيطًا وواضحًا في إنتاج المحتوى ثلاثي الأبعاد)، وهو إطار فعّال لإنشاء الكائنات ثلاثية الأبعاد، وتحريرها، وتحسينها، من خلال إعادة استخدام نموذج انتشار للصور ثنائية الأبعاد مُدرّب مسبقًا لغرض الإنتاج ثلاثي الأبعاد. وبشكل محدد، نُعدّل نموذج الانتشار لينشئ ما يُعرف بـ"صورة الحزمة ثلاثية الأبعاد" (3D Bundle Image)، وهي تمثيل مُبَطَّن يتكون من صور متعددة الزوايا وخرائط الاتجاهات المقابلة لها. ثم تُستخدم خرائط الاتجاهات لإعادة بناء شبكة ثلاثية الأبعاد، بينما توفر الصور متعددة الزوايا خريطة نسيج، ما يؤدي إلى إنشاء نموذج ثلاثي الأبعاد كامل. ويُعد هذا النهج البسيط وسيلة فعّالة لتحويل مشكلة الإنتاج ثلاثي الأبعاد إلى مهمة إنتاج صور ثنائية الأبعاد، مما يُحسّن الاستفادة القصوى من المعرفة المحتواة في النماذج المُدرّبَة مسبقًا. علاوةً على ذلك، نُظهر أن نموذج Kiss3DGen متوافق مع مختلف تقنيات نماذج الانتشار، ما يُمكّن من دعم ميزات متقدمة مثل تحرير المحتوى ثلاثي الأبعاد، وتحسين الشبكات والنصوص. وبناءً على تجارب واسعة النطاق، نُثبت فعالية نهجنا، مع إبراز قدرته على إنتاج نماذج ثلاثية الأبعاد عالية الجودة بكفاءة.