برنامج تعليمي عبر الإنترنت | مختبر جامعة سنغافورة الوطنية يُصدر نموذج OmniConsistency لتحقيق نقل نمط الصورة فورًا

يهدف أسلوب تصميم الصور إلى تحويل الصورة من نمط إلى آخر مع الحفاظ على مضمونها الدلالي من خلال نموذج مُصمم. في السنوات الأخيرة، ومع ظهور نماذج الانتشار، تحولت أساليب تصميم الصور السائدة من الشبكات العصبية العميقة إلى أساليب مُحسّنة من خلال التكيف منخفض الرتبة (LoRA)، ومع دمجها مع وحدات اتساق الصور، تحسنت جودة التصميم بشكل ملحوظ.
على الرغم من أن نموذج تصميم الصورة قد تلقى ردود فعل جيدة من السوق،ومع ذلك، لا تزال طرق تصميم الصور الحالية تواجه ثلاثة تحديات رئيسية:أولاً، هناك اتساق محدود بين المخرجات المنمقة والمدخلات - على الرغم من أن الوحدات النمطية الموجودة يمكنها ضمان المحاذاة الهيكلية الشاملة، إلا أنها تواجه صعوبة في الاحتفاظ بالتفاصيل والمعلومات الدلالية في المشاهد المعقدة؛ ثانيًا، هناك مشكلة تدهور الأسلوب في سيناريوهات الصورة إلى الصورة - دقة أسلوب LoRA و IPAdapter في هذا الإعداد تكون أقل عادةً من دقة الصور المولدة بالنص؛ ثالثًا، التحكم في التخطيط ليس مرنًا بدرجة كافية - تجد الأساليب التي تعتمد على ظروف صارمة (مثل الحواف والرسومات والمواقف) صعوبة في دعم التغييرات الهيكلية الإبداعية مثل تحويلات إصدار Q.
ولسد هذه الفجوة،في 28 مايو 2025، أصدر مختبر العرض التابع للجامعة الوطنية في سنغافورة OmniConsistency، وهو مكون إضافي للاتساق العالمي يستخدم المحول المنتشر بشكل كبير (DiT).إنه تصميم جاهز للاستخدام بالكامل، ومتوافق مع أي نمط من أنماط LoRA ضمن إطار عمل Flux، ويستند إلى آلية التعلم المتسق لأزواج الصور المنمقة لتحقيق تعميم قوي.
تظهر التجارب أن OmniConsistency يحسن بشكل كبير التماسك البصري والجودة الجمالية.ويحقق أداءً مماثلاً لـ GPT-4o، مما يملأ فجوة الأداء بين النماذج مفتوحة المصدر والنماذج التجارية من حيث اتساق الأسلوب.يُوفر حلاً منخفض التكلفة وسهل التحكم لإنشاء الذكاء الاصطناعي. كما أن توافقه وميزاته سهلة الاستخدام تُسهّل على المطورين والمبدعين استخدامه.
في الوقت الحالي،تم إطلاق "OmniConsistency: A GPT-4o-level Character Style Transfer Model" في قسم "البرامج التعليمية" على الموقع الرسمي لشركة HyperAI.انقر على الرابط أدناه لتجربة البرنامج التعليمي للنشر بنقرة واحدة ⬇️
* عنوان البرنامج التعليمي:https://go.hyper.ai/3mCyv
أعددنا أيضًا مزايا مفاجئة للمستخدمين الجدد. استخدم رمز الدعوة "OmniConsistency" للتسجيل في منصة OpenBayes لتحصل على 4 ساعات مجانية من استخدام بطاقة RTX A6000 (البطاقة صالحة لمدة شهر). الكمية محدودة، والأولوية لمن يصل أولاً!
تشغيل تجريبي
1. بعد الدخول إلى الصفحة الرئيسية لـ hyper.ai، حدد صفحة "البرنامج التعليمي"، ثم حدد "OmniConsistency: نموذج نقل نمط الأحرف على مستوى GPT-4o"، وانقر فوق "تشغيل هذا البرنامج التعليمي عبر الإنترنت".


2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

٣. اختر صورتي "NVIDIA RTX A6000 48GB" و"PyTorch". توفر منصة OpenBayes أربع طرق دفع. يمكنك اختيار "الدفع الفوري" أو "يومي/أسبوعي/شهري" حسب احتياجاتك. انقر على "متابعة". يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على ٤ ساعات من بطاقة RTX 4090 + ٥ ساعات من وقت فراغ المعالج!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. انتظر حتى يتم تخصيص الموارد. تستغرق عملية الاستنساخ الأولى حوالي دقيقتين. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق سهم الانتقال بجوار "عنوان API" للانتقال إلى صفحة العرض التوضيحي. نظرًا لأن النموذج كبير الحجم، يستغرق عرض واجهة WebUI حوالي 3 دقائق، وإلا فسيتم عرض "البوابة سيئة". يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.

عرض التأثير
رفعتُ صورة بورتريه، ومعلمة "تحديد LoRA المدمج" هي LEGO. يظهر التأثير في الشكل أدناه.
