DreamO هو إطار عمل موحد لتخصيص الصور تم إطلاقه في 12 مايو 2025 بواسطة ByteDance وكلية الهندسة الإلكترونية والحاسوبية في كلية الدراسات العليا بجامعة بكين شنتشن. يعتمد المشروع على بنية DiT (محول الانتشار)، الذي يدمج مجموعة متنوعة من مهام إنشاء الصور، ويدعم وظائف معقدة مثل تغيير الزي (IP)، وتغيير الوجه (ID)، ونقل الأسلوب (Style)، والجمع بين عدة موضوعات، ويحقق التحكم في ظروف متعددة من خلال نموذج واحد. نتائج الورقة ذات الصلة هيDreamO: إطار عمل موحد لتخصيص الصور".
يستخدم هذا البرنامج التعليمي الموارد لبطاقة واحدة A6000.
2. أمثلة المشاريع
3. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.
2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج
وصف المعلمة:
مهمة:
عنوان IP: إزالة الخلفية تلقائيًا من صورة الإدخال والاحتفاظ بالجسم الرئيسي للكائن/الشخصية. مناسب للمشاهد مثل الملابس والأشياء.
بطاقة تعريف: استخراج مناطق ملامح الوجه بدقة ودعم انتقال ملامح الهوية. استنادًا إلى خوارزمية التعرف على الوجه المُحسّنة، يمكنه التكيف مع صور شخصية بزوايا وظروف إضاءة مختلفة.
أسلوب: يجب عليك إضافة الأمر "إنشاء صور بنفس النمط" قبل كلمة المطالبة. سوف يرث النظام الخلفية الأصلية والأسلوب البصري، ويحقق التوسع الإبداعي لعناصر التكوين.
عرض: يتم استخدامه للتحكم في عرض الصورة المولدة.
ارتفاع: يتم استخدامه للتحكم في ارتفاع الصورة المولدة.
إرشاد: يتم استخدامه للتحكم في الدرجة التي تؤثر بها المدخلات الشرطية (مثل النص أو الصور) في النماذج التوليدية على النتائج المولدة. ستعمل قيم التوجيه الأعلى على جعل النتائج المولدة تتطابق بشكل أوثق مع شروط الإدخال، بينما ستحتفظ القيم المنخفضة بمزيد من العشوائية.
عدد الخطوات: يمثل عدد تكرارات النموذج أو عدد الخطوات في عملية الاستدلال، ويمثل عدد خطوات التحسين التي يستخدمها النموذج لتوليد النتيجة. يؤدي عدد أكبر من الخطوات عادةً إلى إنتاج نتائج أكثر دقة، ولكن قد يؤدي إلى زيادة وقت الحساب.
البذرة: بذرة رقم عشوائي، تستخدم للتحكم في عشوائية عملية التوليد. يمكن لقيمة البذرة نفسها أن تنتج نفس النتائج (بشرط أن تكون المعلمات الأخرى هي نفسها)، وهو أمر مهم للغاية في إعادة إنتاج النتائج.
كيفية الاستخدام
4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓