HyperAIHyperAI
منذ 2 أشهر

PhotoMaker: تخصيص صور بشرية واقعية عبر تضمين المعرف المكدس

Li, Zhen ; Cao, Mingdeng ; Wang, Xintao ; Qi, Zhongang ; Cheng, Ming-Ming ; Shan, Ying
PhotoMaker: تخصيص صور بشرية واقعية عبر تضمين المعرف المكدس
الملخص

التطورات الحديثة في توليد الصور من النص قد أحرزت تقدمًا ملحوظًا في إنشاء صور بشرية واقعية بناءً على تعليمات نصية معطاة. ومع ذلك، لا تستطيع الطرق الشخصية الحالية تحقيق متطلبات الكفاءة العالية، والدقة الواعدة في الهوية (ID)، والتحكم المرن في النص بشكل متزامن. في هذا البحث، نقدم PhotoMaker، وهي طريقة شخصية فعالة لتوليد الصور من النص، والتي تقوم بشكل أساسي بتشفير عدد غير محدد من صور الهوية المدخلة إلى مجموعة تضمينات الهوية لحفظ معلومات الهوية. يمكن لهذه التضمينات، التي تعمل كتمثيل موحد للهوية، ليس فقط حمل خصائص نفس صورة الهوية بشكل شامل، بل أيضًا استيعاب خصائص هويات مختلفة للدمج اللاحق. وهذا يفتح الطريق لتطبيقات أكثر إثارة وإيجابية من الناحية العملية. بالإضافة إلى ذلك، لدفع تدريب PhotoMaker لدينا، نقترح خط أنابيب بناء البيانات موجه نحو الهوية (ID) لجمع بيانات التدريب. تحت رعاية مجموعة البيانات التي تم بناؤها عبر الخط الأنبوبي المقترح، يظهر PhotoMaker لدينا قدرة أفضل على الحفاظ على الهوية مقارنة بالطرق المستندة إلى التعديل الدقيق خلال وقت الاختبار، مع توفير تحسينات كبيرة في السرعة ونتائج توليد عالية الجودة وقدرات تعميم قوية ومجال واسع من التطبيقات. صفحة مشروعنا متاحة على الرابط https://photo-maker.github.io/

PhotoMaker: تخصيص صور بشرية واقعية عبر تضمين المعرف المكدس | أحدث الأوراق البحثية | HyperAI