HyperAIHyperAI

Command Palette

Search for a command to run...

PhotoMaker: تخصيص صور بشرية واقعية عبر تضمين المعرف المكدس

Zhen Li extsuperscript1,2∗ Mingdeng Cao extsuperscript2,3∗ Xintao Wang extsuperscript2 Zhongang Qi extsuperscript2 Ming-Ming Cheng extsuperscript1† Ying Shan extsuperscript2

الملخص

التطورات الحديثة في توليد الصور من النص قد أحرزت تقدمًا ملحوظًا في إنشاء صور بشرية واقعية بناءً على تعليمات نصية معطاة. ومع ذلك، لا تستطيع الطرق الشخصية الحالية تحقيق متطلبات الكفاءة العالية، والدقة الواعدة في الهوية (ID)، والتحكم المرن في النص بشكل متزامن. في هذا البحث، نقدم PhotoMaker، وهي طريقة شخصية فعالة لتوليد الصور من النص، والتي تقوم بشكل أساسي بتشفير عدد غير محدد من صور الهوية المدخلة إلى مجموعة تضمينات الهوية لحفظ معلومات الهوية. يمكن لهذه التضمينات، التي تعمل كتمثيل موحد للهوية، ليس فقط حمل خصائص نفس صورة الهوية بشكل شامل، بل أيضًا استيعاب خصائص هويات مختلفة للدمج اللاحق. وهذا يفتح الطريق لتطبيقات أكثر إثارة وإيجابية من الناحية العملية. بالإضافة إلى ذلك، لدفع تدريب PhotoMaker لدينا، نقترح خط أنابيب بناء البيانات موجه نحو الهوية (ID) لجمع بيانات التدريب. تحت رعاية مجموعة البيانات التي تم بناؤها عبر الخط الأنبوبي المقترح، يظهر PhotoMaker لدينا قدرة أفضل على الحفاظ على الهوية مقارنة بالطرق المستندة إلى التعديل الدقيق خلال وقت الاختبار، مع توفير تحسينات كبيرة في السرعة ونتائج توليد عالية الجودة وقدرات تعميم قوية ومجال واسع من التطبيقات. صفحة مشروعنا متاحة على الرابط https://photo-maker.github.io/


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp