Command Palette
Search for a command to run...
PhotoMaker: تخصيص صور بشرية واقعية عبر تضمين المعرف المكدس
PhotoMaker: تخصيص صور بشرية واقعية عبر تضمين المعرف المكدس
Zhen Li extsuperscript1,2∗ Mingdeng Cao extsuperscript2,3∗ Xintao Wang extsuperscript2 Zhongang Qi extsuperscript2 Ming-Ming Cheng extsuperscript1† Ying Shan extsuperscript2
الملخص
التطورات الحديثة في توليد الصور من النص قد أحرزت تقدمًا ملحوظًا في إنشاء صور بشرية واقعية بناءً على تعليمات نصية معطاة. ومع ذلك، لا تستطيع الطرق الشخصية الحالية تحقيق متطلبات الكفاءة العالية، والدقة الواعدة في الهوية (ID)، والتحكم المرن في النص بشكل متزامن. في هذا البحث، نقدم PhotoMaker، وهي طريقة شخصية فعالة لتوليد الصور من النص، والتي تقوم بشكل أساسي بتشفير عدد غير محدد من صور الهوية المدخلة إلى مجموعة تضمينات الهوية لحفظ معلومات الهوية. يمكن لهذه التضمينات، التي تعمل كتمثيل موحد للهوية، ليس فقط حمل خصائص نفس صورة الهوية بشكل شامل، بل أيضًا استيعاب خصائص هويات مختلفة للدمج اللاحق. وهذا يفتح الطريق لتطبيقات أكثر إثارة وإيجابية من الناحية العملية. بالإضافة إلى ذلك، لدفع تدريب PhotoMaker لدينا، نقترح خط أنابيب بناء البيانات موجه نحو الهوية (ID) لجمع بيانات التدريب. تحت رعاية مجموعة البيانات التي تم بناؤها عبر الخط الأنبوبي المقترح، يظهر PhotoMaker لدينا قدرة أفضل على الحفاظ على الهوية مقارنة بالطرق المستندة إلى التعديل الدقيق خلال وقت الاختبار، مع توفير تحسينات كبيرة في السرعة ونتائج توليد عالية الجودة وقدرات تعميم قوية ومجال واسع من التطبيقات. صفحة مشروعنا متاحة على الرابط https://photo-maker.github.io/