HyperAI

يمكن لـ Kolors Kuaishou استخدام الصور والنصوص لإنشاء نماذج كبيرة

ألوان نموذج كبير من Wenshengtu يفهم اللغة الصينية بشكل أفضل

مقدمة النموذج

Kolors هو نموذج واسع النطاق لتوليد النصوص إلى الصور يعتمد على الانتشار الكامن تم تطويره بواسطة فريق Kuaishou Kolors. تم تدريب Kolors على مليارات أزواج النصوص والصور، ويوضح مزايا كبيرة مقارنة بالنماذج مفتوحة المصدر والمغلقة المصدر من حيث الجودة البصرية، ودقة الدلالات المعقدة، وتقديم النصوص لكل من الأحرف الصينية والإنجليزية. بالإضافة إلى ذلك، يدعم Kolors الإدخال باللغتين الصينية والإنجليزية، ويظهر أداءً قويًا في فهم المحتوى الصيني وتوليده. النتائج المولدة قابلة للمقارنة مع Midjourney-v6 وتدعم إدخال نص يصل طوله إلى 256 حرفًا.

كيفية الركض

1. استنساخ وتشغيل الحاوية

2. عندما تكون الحاوية في حالة "تشغيل"، انسخ عنوان API وافتحه في المتصفح

3. بعد فتح الرابط، يمكنك رؤية الواجهة التالية

4. انقر أدناه لتحميل صورة وأدخل النص المطلوب، انقر فوق إنشاء صورة تم توليد النتيجة

يمكنك أيضًا تعديل المعلمات ذات الصلة حسب الحاجة

  • الارتفاع: تعديل ارتفاع الصورة المولدة
  • العرض: تعديل عرض الصورة المُولدة
  • خطوات الاستدلال: عدد خطوات إزالة الضوضاء المستخدمة عند إنشاء صورة. عادةً، يؤدي استخدام العدد الافتراضي لخطوات الاستدلال (على سبيل المثال 50) إلى إنتاج صور عالية الجودة. إذا كنت بحاجة إلى معاينة التأثير الناتج بسرعة، فيمكنك استخدام رقم خطوة أصغر؛ إذا كنت تريد الحصول على نتيجة ذات جودة أعلى، يمكنك استخدام رقم خطوة أكبر.
  • مقياس التوجيه: هو أحد المعلمات الفائقة التي تتحكم في الدرجة التي يطيع بها النموذج الإرشادات النصية عند إنشاء الصور. عندما تكون القيمة أكبر (على سبيل المثال، أكبر من 7)، قد تكون الصورة المولدة أقرب بصريًا إلى وصف موجه النص، مع جودة أعلى واتساق. عند قيم أصغر (على سبيل المثال أقل من 7)، قد تظهر الصور المولدة تنوعًا أكبر وسيعتمد النموذج بشكل أقل على الإشارات النصية عند إنشاء الصور، مما يسمح بمزيد من الإبداع والتنوع.
  • الصور لكل مطالبة: تعديل عدد الصور التي تم إنشاؤها بواسطة النموذج.

5. توليد النتائج

المناقشة والتبادل

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓