HyperAIHyperAI

Command Palette

Search for a command to run...

XVerse: التحكم المتسق في الهوية والخصائص الدلالية لعدة مواضيع من خلال تعديل DiT

Bowen Chen Mengyi Zhao Haomiao Sun Li Chen Xu Wang Kang Du Xinglong Wu

الملخص

تحقيق التحكم الدقيق في الهوية الموضوعية والسمات الدلالية (الوضع، الأسلوب، الإضاءة) في توليد الصور من النص، خاصة بالنسبة لموضوعات متعددة، غالباً ما يقوض قابلية التعديل والتماسك نماذج متحولات الانتشار (DiTs). العديد من الأساليب تدخل تشوهات أو تعاني من تشابك السمات. لتجاوز هذه التحديات، نقترح نموذجاً جديداً لتوليد صور متعددة المواضيع تحت السيطرة يُدعى XVerse. من خلال تحويل الصور المرجعية إلى اختلافات لتعديل مجرى النص المحدد للرمز، يتيح XVerse التحكم الدقيق والاستقلالي في موضوع معين دون إرباك الكامنات أو الخصائص الصورية. ونتيجة لذلك، يقدم XVerse تركيب صور متعددة المواضيع قابل للتعديل بجودة عالية مع سيطرة قوية على خصائص الموضوع الفردي والسمات الدلالية. هذا التقدم يحسن بشكل كبير قدرات توليد المشاهد الشخصية والمعقدة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
XVerse: التحكم المتسق في الهوية والخصائص الدلالية لعدة مواضيع من خلال تعديل DiT | مستندات | HyperAI