HyperAI

برنامج تعليمي عبر الإنترنت: إطار عمل ByteDance مفتوح المصدر لتوليد الصور InfiniteYou لتحقيق انتقال عالي الدقة لميزات الوجه

特色图像

InfiniteYou (InfU باختصار) هو إطار عمل لتوليد الصور المحفوظة بالهوية استنادًا إلى Diffusion Transformers الذي تم إطلاقه مؤخرًا بواسطة ByteDance Intelligent Creation.ويستخدم تكنولوجيا متقدمة للحفاظ على اتساق هوية الشخص أثناء إنشاء الصور، أي أنه يمكنه الاحتفاظ بدقة بملامح الوجه عند إنشاء صور لمشاهد مختلفة..

باعتبارها واحدة من أقدم الأطر في هذا المجال لاستخدام المحولات المنتشرة (DiTs)، فإن InfU تعالج بشكل منهجي ثلاث قضايا أساسية في الأساليب الحالية: عدم كفاية تشابه الهوية، وتحيز محاذاة الصورة والنص، وضعف جودة التوليد والأداء الجمالي. إن ابتكارها الأساسي، InfuseNet، يحقن ميزات الهوية في نموذج DiT الأساسي من خلال الاتصالات المتبقية، مما يحسن بشكل كبير من دقة الهوية مع الحفاظ على قدرات التوليد. تم اعتماد استراتيجية تدريب متعددة المراحل تتضمن التدريب المسبق والضبط الدقيق المشرف (SFT) مع بيانات اصطناعية متعددة العينات لشخص واحد (SPMS) لتحسين محاذاة النص والصورة بشكل أكبر وتحسين جودة التوليد وتخفيف تأثير تكرار الوجه بشكل فعال.تظهر التجارب المكثفة أن InfU يحقق أداءً على مستوى SOTA، متجاوزًا الطرق الأساسية الحالية في جميع الجوانب..

حاليًا، تم إطلاق البرنامج التعليمي "InfiniteYou High-Fidelity Image Generation Demo" على قسم البرامج التعليمية بالموقع الرسمي لشركة HyperAI.إذا كنت مهتمًا، تعال وجربه بنفسك!

عنوان البرنامج التعليمي:

https://go.hyper.ai/xQnpS

تشغيل تجريبي

1. قم بتسجيل الدخول إلى hyper.ai، في صفحة البرامج التعليمية، حدد InfiniteYou High-Fidelity Image Generation Demo، ثم انقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.

2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

3. حدد الصور "NVIDIA RTX A6000" و"PyTorch". توفر منصة OpenBayes أربع طرق للدفع. يمكنك اختيار "الدفع حسب الاستخدام" أو "يوميًا/أسبوعيًا/شهريًا" وفقًا لاحتياجاتك. انقر فوق "متابعة".يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على 4 ساعات من RTX 4090 + 5 ساعات من وقت فراغ وحدة المعالجة المركزية!

رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. انتظر حتى يتم تخصيص الموارد. تستغرق عملية الاستنساخ الأولى حوالي دقيقتين. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق سهم الانتقال بجوار "عنوان API" للانتقال إلى صفحة العرض التوضيحي. يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.

عرض التأثير

1. بعد الدخول إلى صفحة العرض التوضيحي، قم أولاً بتحميل صورة تحتوي على وجه في "صورة الهوية"، ثم أدخل المطالبة وحدد إصدار النموذج في "إصدار النموذج". هنا، يتم استخدام "aes_stage2" بشكل افتراضي للحصول على محاذاة أفضل للصورة والنص وتأثيرات التوليد. إذا كنت بحاجة إلى تشابه معرف أعلى، فيرجى تجربة "sim_stage1". في "صورة التحكم [اختياري]"، يمكنك تحميل صورة تحكم للوجه. سيقوم النموذج باستخراج 5 نقاط رئيسية للوجه للتحكم في التوليد. هذا ليس عنصرا ضروريا. وأخيرًا، انقر فوق "إنشاء" لتوليد الصورة.

2. تم تحميل صورة Yann Lecun هنا، ويمكنك أن ترى أن التأثير الناتج جيد جدًا.

*الموجه: رجل متطور يتمتع بالثقة. كان يرتدي سترة بنية اللون من التسعينيات ذات ياقة عالية، مقترنة ببلوزة ذات رقبة مدورة باللون الرمادي الداكن. سرواله مصمم خصيصًا باللون الفحمي، ويكمله حزام جلدي أنيق. تتميز الخلفية بمكتبة أنيقة تحتوي على أرفف كتب ومدفأة رخامية وإضاءة دافئة، مما يخلق جوًا راقيًا ومريحًا. إن وضعيته المريحة ووضعية يده في جيبه تزيد من رباطة جأشه وأسلوبه الأنيق

ما ورد أعلاه هو البرنامج التعليمي الموصى به من قبل HyperAI هذه المرة. تعال وجربها بنفسك!

عنوان البرنامج التعليمي:https://go.hyper.ai/xQnpS