دروس تعليمية عبر الإنترنت | تم الإشادة بـ يان ليكون الفائز بجائزة تورينج! يفتح Xiaohongshu المصدر InstantID، مما يسمح للمستخدمين بتخصيص الصور بأنماط متعددة باستخدام صورة أصلية واحدة فقط

منذ فترة ليست طويلة، قامت مجموعة من مهندسي ما بعد عام 1995 من شياوهونغشو وفريق من جامعة بكين بإصدار مشروع مفتوح المصدر "InstantID".ما عليك سوى تحميل صورة، ويمكن لأداة الصور AI هذه تخصيص صور AI بسهولة بأشكال مختلفة، مما يعني وداعًا لتحرير الصور الممل.
بمجرد إصدار InstantID، جذب اهتمامًا واسع النطاق، مع وجود 9.9 ألف مجموعة على GitHub. كما قام الفائز بجائزة تورينج، يان ليكون، بإعادة نشر مثال تم إنشاؤه بواسطة الفريق في صورته على حسابه الاجتماعي للتعبير عن دعمه.

في الماضي، كان إنشاء النص إلى صورة بناءً على موضوع يتطلب عادةً التدريب على مجموعات بيانات متعددة تحتوي على الموضوع (مثل الأشخاص والأنماط). تتضمن الحلول التمثيلية DreamBooth وLoRAs. ومع ذلك، فإن متطلبات التخزين العالية وعملية الضبط الدقيق التي تستغرق وقتًا طويلاً لمثل هذه الحلول تثبط عزيمة العديد من المستخدمين، مما يؤدي إلى عدم القدرة على تطبيقها بسرعة في السيناريوهات الحقيقية. وقد أدى ظهور InstantID إلى كسر هذا الجمود.

ينقسم مبدأ عمل InstantID بشكل أساسي إلى ثلاثة أجزاء:
* تضمين الهوية:استخراج ميزات الوجه الدلالية في تضمين الوجه من خلال نموذج التعرف على الوجه المدرب مسبقًا. يعتبر هذا التضمين غنيًا بالمعلومات الدلالية، مثل ملامح الوجه، وتعبيرات الوجه، والعمر، وما إلى ذلك، مما يوفر أساسًا متينًا لتوليد الصور لاحقًا.
* صورة محول:تم تقديم وحدة تكيف خفيفة الوزن لدمج معلومات الهوية المستخرجة مع مطالبات النص. من خلال آلية الاهتمام المتبادل المنفصلة، يمكن للصور والنصوص التأثير بشكل مستقل على توليد الصورة، مع الحفاظ على معلومات الهوية والتحكم بدقة في نمط الصورة.
* شبكة الهوية:يقوم بتشفير السمات المعقدة لصورة الوجه المرجعية من خلال ظروف دلالية قوية (مثل الوصف التفصيلي لسمات الوجه) وظروف مكانية ضعيفة (مثل مواقع المعالم الوجهية). يتم توجيه عملية التوليد من خلال تضمين الوجه ولا تتطلب معلومات نصية. كل ما يحتاج إليه هو التحديث للوحدات المضافة حديثًا، مع الحفاظ على نموذج النص إلى الصورة المدرب مسبقًا مجمدًا لضمان المرونة.
اترك التعقيد للكود واترك البساطة للمستخدمين!لا يحقق InstantID تقدمًا تقنيًا في تركيب الصور الشخصية في وقت صفر فحسب، بل يحقق أيضًا بساطة وبديهية شديدة في تجربة المستخدم. سواء كنت مبتدئًا في التصميم أو خبيرًا في الفن، يمكنك بسهولة إنشاء صور مخصصة على هذه المنصة. تتضمن سيناريوهات التطبيق المحددة ما يلي:
* تركيب متعدد الهوية ومتعدد الأنماط
يتيح InstantID إمكانية "التعاون عبر الحدود" بنقرة واحدة!

* التوليف المنمق
ما عليك سوى إدخال صورة وجه لتوليد مجموعة متنوعة من صور الذكاء الاصطناعي ذات الأنماط المخصصة.

* تركيب واقعي
هل هذه الصور مركبة حقا؟

* استيفاء الهوية
يمكنك أيضًا دمج صور يانغ مي وتايلور. (ملاحظة: باستخدام هذه الوظيفة، يمكنك أيضًا التنبؤ بالمظهر المستقبلي لطفلك استنادًا إلى وزن وجهي الوالدين!)

* منظور جديد للتوليف
صورة أصلية واحدة + صورة مرجعية واحدة للأسلوب = شخصية مشهورة متعددة الاستخدامات

* تركيب غير عمودي
ماذا يحدث عندما يندمج الإنسان والحيوان؟

هناك العديد من الأنماط التي يمكنك الاختيار من بينها، ألا يمكنك الانتظار لتجربتها؟ لا تقلق،أطلقت شركة HyperAI البرنامج التعليمي "عرض تجريبي لإنشاء الصور الشخصية باستخدام InstantID".لقد قام هذا البرنامج التعليمي ببناء البيئة المناسبة لك. انقر فوق "استنساخ" لبدء تشغيله بنقرة واحدة. تعالوا وحققوا "تحولاتكم الاثنين والسبعين"!
عنوان البرنامج التعليمي العام:
https://hyper.ai/tutorials/31559
تشغيل تجريبي
1. قم بتسجيل الدخول إلى hyper.ai، وفي صفحة البرنامج التعليمي، حدد InstantID Personalized Photo Generation Demo. انقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.

2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك. انقر فوق "التالي: حدد معدل التجزئة" في الزاوية اليمنى السفلية.


3. بعد القفزة، حدد "NVIDIA GeForce RTX 4090" وانقر فوق "التالي: المراجعة".يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على 4 ساعات من RTX 4090 + 5 ساعات وحدة المعالجة المركزية حرمعدل التجزئةمدة!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej

4. انقر فوق "متابعة التنفيذ" وانتظر حتى يتم تخصيص الموارد. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق "فتح مساحة العمل".


5. قم بإنشاء جلسة طرفية جديدة على صفحة بدء التشغيل وأدخل الأمر التالي.
cd InstantID


6. أدخل الأمر التالي لتشغيل العرض التوضيحي لـ Gradio.
python gradio_demo/app.py

7. عندما يعرض سطر الأوامر "جاري التشغيل على عنوان URL المحلي: https://0.0.0.0:8080"، انسخ عنوان API الموجود على اليمين في شريط عنوان المتصفح للوصول إلى صفحة InstantID.يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.



عرض التأثير
1. افتح صفحة InstantID، وقم بتحميل صورة شخصية، ثم قم بتحميل صورة مرجعية. ومن بينها دور الصورة المرجعية في تحديد موضع الشخصية في الصورة.

2. تحسين تعديلات المعلمات التالية.
*اكتب الكلمات الرئيسية للصورة التي تريد إنشاءها في مربع "المطالبة". عادةً ما يكون الموجه مستندًا إلى الصورة الأولية. إذا كانت الصورة المرفوعة لرجل، يمكنك كتابة "رجل".
*انقر على خيار "الاستدلال السريع القابل للتنفيذ باستخدام المضاعف المشترك الأصغر". إذا لم يتم تشغيله، فسوف تكون سرعة إنشاء الصورة أبطأ قليلاً.

*يمكن لمحدد النمط "قالب النمط" تحسين الكلمات المطلوبة، بما في ذلك التأثيرات مثل "ألوان مائية" و"فن الخط".
*「قوة IdentityNet (للإخلاص)」قوة الوجه أو قوة الهوية، تعمل على صورة الشخصية المستوردة مبدئيًا. كلما ارتفع المعامل، كلما كانت الصورة المولدة أكثر تشابهًا مع صورة الشخصية. القيمة الافتراضية هي 0.8.
*「قوة محول الصورة (للتفاصيل)」قوة مرجع الصورة، تعمل على الصورة المرجعية، تحدد القوة التشابه بين الصورة المولدة والصورة المرجعية، والقيمة الافتراضية هي 0.8.

*「الخيارات المتقدمة」ضبط المعلمات المتقدمة.
*"المطالبة السلبية"، كلمات المطالبة السلبية، يمكنك ملء بعض المحتوى الذي لا تريد أن تحتويه الصورة النهائية المولدة، مثل تجنب الكلمات ذات الجودة المنخفضة، وما إلى ذلك.
*بالنسبة لـ "عدد خطوات العينة"، و"مقياس التوجيه"، و"البذرة"، ما عليك سوى تحديد القيم الافتراضية.
*「بذرة عشوائية」بذرة عشوائية، قم بتشغيلها.
*يعمل "تعزيز المنطقة غير الظاهرة للوجه" على تقوية المنطقة غير الظاهرة للوجه. عند تشغيله، سيتم زيادة وزن محدد النمط.

3. انقر فوق "إرسال" وسيتم إنشاء الصورة في 5 ثوانٍ.


في الوقت الحاضر، أطلق الموقع الرسمي لـ HyperAI مئات من البرامج التعليمية المختارة المتعلقة بالتعلم الآلي، والتي تم تنظيمها في شكل Jupyter Notebook.
انقر على الرابط للبحث عن الدروس ومجموعات البيانات ذات الصلة:https://hyper.ai/tutorials
ما سبق هو كل المحتوى الذي تمت مشاركته بواسطة HyperAI Super Neural Network هذه المرة. إذا رأيت مشاريع عالية الجودة، يرجى ترك رسالة في الخلفية لتوصيتها لنا! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس "مجموعة تبادل الدروس التعليمية للانتشار المستقر". نرحب بالأصدقاء للانضمام إلى المجموعة لمناقشة القضايا الفنية المختلفة ومشاركة نتائج التطبيق ~
امسح رمز الاستجابة السريعة للانضمام إلى مجموعة تبادل الدروس التعليمية

إذا كان رمز الاستجابة السريعة للانضمام إلى المجموعة غير صالح، فيمكنك مسح رمز الاستجابة السريعة أدناه لإضافة حساب WeChat الخاص بـ Neuro Star (معرف WeChat: Hyperai01)، ولاحظ "SD Tutorial Exchange Group"، ويمكنك الانضمام إلى الدردشة الجماعية.
