HyperAI

UNO: إنشاء صور مخصصة عالمية

صورة
يبني
يبني
يبني

1. مقدمة البرنامج التعليمي

مشروع UNO هو نموذج لتوليد الصور بالذكاء الاصطناعي أصدره فريق الإنشاء الذكي في ByteDance في أبريل 2025. يمكنه دعم توليد الصور ذات الموضوع الواحد والمتعددة، وتوحيد مهام متعددة باستخدام نموذج واحد، وإظهار قدرات تعميم قوية. نتائج الورقة ذات الصلة هيالتعميم من الأقل إلى الأكثر: إطلاق العنان لمزيد من القدرة على التحكم من خلال التوليد في السياق".

يدعم المشروع تنسيقات بيانات متعددة وواجهات تخزين خلفية، ويتمتع بإمكانيات قوية لتحسين الاستعلام وقابلية التوسع المرنة، وهو مناسب لسيناريوهات تحليل البيانات واسعة النطاق. تلتزم UNO بمساعدة المطورين في بناء عمليات معالجة بيانات فعالة بسهولة من خلال واجهات برمجة تطبيقات بسيطة وميزات وظيفية غنية، وتوفير دعم البنية التحتية للبيانات الموثوقة للمؤسسات والمطورين.

يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.

👉 يقدم هذا المشروع نموذجًا لـ:

  • FLUX.1-dev-fp 8: هذا محول مقوم ذو 12 مليار معلمة قادر على توليد صور من أوصاف نصية.

أمثلة المشاريع

2. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

إذا لم يتم عرض "النموذج"، فهذا يعني أنه يتم تهيئة النموذج. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

❗️نصائح هامة للاستخدام:

  • عدد الخطوات:  يمثل عدد تكرارات النموذج أو عدد الخطوات في عملية الاستدلال، ويمثل عدد خطوات التحسين التي يستخدمها النموذج لتوليد النتيجة. يؤدي عدد أكبر من الخطوات عادةً إلى إنتاج نتائج أكثر دقة، ولكن قد يؤدي إلى زيادة وقت الحساب.
  • إرشاد:  يتم استخدامه للتحكم في الدرجة التي تؤثر بها المدخلات الشرطية (مثل النص أو الصور) في النماذج التوليدية على النتائج المولدة. ستعمل قيم التوجيه الأعلى على جعل النتائج المولدة تتطابق بشكل أوثق مع شروط الإدخال، بينما ستحتفظ القيم المنخفضة بمزيد من العشوائية.
  • البذرة:  هي بذرة الرقم العشوائي، والتي تستخدم للتحكم في عشوائية عملية التوليد. يمكن لقيمة البذرة نفسها أن تنتج نفس النتائج (بشرط أن تكون المعلمات الأخرى هي نفسها)، وهو أمر مهم للغاية في إعادة إنتاج النتائج.

كيفية الاستخدام

التبادل والمناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

شكرًا لمستخدم Github xxxجججج1  لإنتاج هذا البرنامج التعليمي، معلومات مرجعية للمشروع هي كما يلي:

@article{wu2025less,
  title={Less-to-More Generalization: Unlocking More Controllability by In-Context Generation},
  author={Wu, Shaojin and Huang, Mengqi and Wu, Wenxu and Cheng, Yufeng and Ding, Fei and He, Qian},
  journal={arXiv preprint arXiv:2504.02160},
  year={2025}
}