PhotoMaker V2: تحسين دقة الهوية وتحكم أكبر في الإصدار 1

مقدمة البرنامج التعليمي

PhotoMaker هو نموذج فعال لتخصيص الصور الشخصية تم إطلاقه مفتوح المصدر بواسطة فريق Tencent في عام 2024. يمكنه إنشاء صور مخصصة بأسلوب فني بسرعة استنادًا إلى صور الصور الشخصية. بالإضافة إلى إنشاء صور شخصية مخصصة، فإنه يمكنه أيضًا تغيير عمر وجنس الشخصيات، ودمج خصائص الشخصيات المختلفة لإنشاء معلومات شخصية جديدة. إنها أداة رسم الذكاء الاصطناعي العملية للغاية. يعد هذا البرنامج التعليمي الإصدار 2.0 من PhotoMaker، والذي قام بتحسين الاتساق والقدرة على التحكم في الأحرف بشكل كبير مقارنةً بالإصدار V1.

لقد قام هذا البرنامج التعليمي بالفعل بإعداد البيئة ذات الصلة. كل ما عليك فعله هو إدخال أمر لتجربة العرض التوضيحي.

تحسينات كبيرة في PhotoMaker V2

تم تحسين دقة الهوية بشكل أكبر، وخاصةً لإدخال صورة واحدة وإدخال وجه آسيوي. إن إدخال المزيد من صور الوجه قد يؤدي إلى نتائج أفضل.
من خلال دمج ControlNet وtwi-adapter وIP-Adapter، أصبحت عملية التوليد أكثر قابلية للتحكم. وقد قدم فريق البحث النص المقابل للرجوع إليه. بالإضافة إلى ذلك، يسمح PhotoMaker V2 للمستخدمين بتحقيق اتساق أفضل للمعرف من خلال دمجه مع IP-Adapter-FaceID وInstantID وCharacter LoRA.
يرث برنامج PhotoMaker V2 الميزات الجيدة لبرنامج PhotoMaker V1، مثل الجودة العالية وإمكانيات التوليد المتنوعة، بالإضافة إلى التحكم القوي في النص. بالإضافة إلى ذلك، يمكنه دمج النماذج السابقة، مثل إعادة الأشخاص في الصور أو اللوحات القديمة إلى الواقع، وخلط الهوية، وتغيير العمر أو الجنس.

عرض التأثير

كيفية الركض

1. بعد استنساخ الحاوية وبدء تشغيلها، افتح مساحة العمل

2. قم بإنشاء محطة طرفية جديدة وأدخل الأمر `bash run.sh`

3. بعد ظهور المنفذ 8080، انقر فوق الرابط الموجود في عنوان API على اليمين لإدخال تجربة النموذج

4. بعد الدخول إلى الموقع، يمكنك رؤية الواجهة التالية

قم بتحميل صورة الشخصية التي تريد استخدامها (يمكنك تحميل صور متعددة)
باستخدام مطالبات الإدخال باللغة الإنجليزية، سيقوم النموذج بإنشاء صور استنادًا إلى مطالبات الإدخال.

لاحظ أن مفردات الفئة التي سيتم إنشاؤها يجب أن تستخدم الكلمة المحفزة img، مثل man img، woman img، girl img.

حدد النمط المطلوب من قالب النمط. هذه الأنماط هي بعض المطالبات المحددة مسبقًا.
انقر فوق "إرسال" لإنشاء الصورة.

هناك بعض الأمثلة في أسفل الموقع. انقر عليها لتحميلها مباشرة.

يمكنك أيضًا تغيير الإعدادات المتقدمة وفقًا لاحتياجاتك. وفيما يلي بعض أوصاف المعلمات.

المطالبة السلبية: تحدد الميزات التي يجب تجنبها عند إنشاء الإخراج. من خلال إدخال مصطلحات مثل "التناظر السيئ، الجودة الرديئة، الجودة المنخفضة، التوضيح، ثلاثي الأبعاد، ثنائي الأبعاد، الرسم، الرسوم المتحركة، الرسم التخطيطي، الفم المفتوح"، سيحاول النموذج تجنب تضمين هذه الميزات في الصور المولدة.
عدد خطوات العينة: يتحكم هذا في عدد الخطوات التي يتخذها النموذج عند إنشاء الصور. عادةً ما تؤدي الخطوات الأكثر إلى إنتاج صور ذات جودة أعلى لأن النموذج لديه فرص أكثر لتحسين الناتج.
قوة النمط: يشير هذا إلى مدى تأثير النمط المحدد على الصورة الناتجة. كلما ارتفعت النسبة، كلما كان الأسلوب أكثر تأثيرا.
عدد الصور الناتجة: يحدد هذا عدد الصور التي يجب أن ينشئها النموذج في عملية توليد واحدة
مقياس التوجيه: تضبط هذه المعلمة مدى صرامة التزام النموذج بالتعليمات. إن نسبة التوجيه الأعلى تعني أن النموذج يتبع التوجيه عن كثب، مما قد يؤدي إلى نتائج أكثر دقة ولكن أقل إبداعًا.
البذرة: يتم استخدام قيمة البذرة لتهيئة مولد الأرقام العشوائية والتأثير على الناتج. من خلال تعيين بذرة محددة، يمكنك ضمان الحصول على نتائج قابلة للتكرار. سيؤدي تحديد "عشوائية البذور" إلى إنشاء صورة مختلفة في كل مرة.

المناقشة والتبادل

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [تبادل الدروس] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓