عرض توضيحي لإنشاء صور كبيرة باستخدام Stable-Diffusion-3.5
نشر Stable Diffusion 3.5 Large بنقرة واحدة
مقدمة البرنامج التعليمي
该教程仅需 RTX 4090 即可启动。
Stable Diffusion 3.5 عبارة عن سلسلة من نماذج توليد الصور المتقدمة بالذكاء الاصطناعي التي أطلقتها شركة Stability AI في عام 2024، وهو ما يمثل تقدمًا كبيرًا في نماذج توليد الصور بالذكاء الاصطناعي مفتوحة المصدر. تتضمن السلسلة عدة إصدارات من النموذج لتلبية احتياجات مجموعات المستخدمين المختلفة، بما في ذلك الباحثين العلميين، والهواة، والشركات الناشئة، والمؤسسات.
يوفر Stable Diffusion 3.5 ثلاثة أحجام من النماذج: كبير، وتوربو كبير، ومتوسط. يحتوي الطراز الكبير على 8 مليار معلمة وهو مناسب لسيناريوهات التطبيقات الاحترافية بدقة ميجا بكسل؛ Large Turbo هو إصدار مبسط من Large الذي يمكنه إنشاء صور عالية الجودة بسرعة؛ يحتوي النموذج المتوسط على 2.5 مليار معلمة وهو مصمم للعمل على أجهزة مخصصة للمستهلك، مع تحقيق التوازن بين الجودة وسهولة التخصيص.
من الميزات البارزة الأخرى لنماذج سلسلة Stable Diffusion 3.5 هي إمكانية تخصيصها. عند تطوير هذه النماذج، ركزت شركة Stability AI بشكل خاص على أهمية التعديلات الشخصية، مما يسمح للمستخدمين بضبط النماذج بسهولة وفقًا لاحتياجاتهم المحددة. لا توفر هذه المرونة للفنانين والمصممين مساحة إبداعية واسعة فحسب، بل توفر أيضًا للمطورين إمكانية إنشاء سير عمل مخصصة. وبالإضافة إلى ذلك، فإن التنوع والشمولية التي تظهرها هذه النماذج عند إنشاء الصور تشكل أيضًا أحد أهم النقاط البارزة. إنهم قادرون على إنشاء صور تمثل خلفيات وخصائص ثقافية مختلفة، مما يثري بشكل كبير سيناريوهات تطبيق توليد الصور بالذكاء الاصطناعي. من النمذجة ثلاثية الأبعاد إلى التصوير الفوتوغرافي، ومن الرسم إلى فن الخطوط، يمكن لـ Stable Diffusion 3.5 محاكاة أي نمط مرئي يمكن تخيله تقريبًا، مما يوفر للمستخدمين إمكانيات إبداعية غير محدودة.
يستخدم هذا البرنامج التعليمي نموذج Stable Diffusion 3.5 Large، وهو نموذج تحويل النص إلى صورة من خلال مولد الانتشار المتعدد الوسائط (MMDiT) والذي يتميز بتحسينات كبيرة في جودة الصورة والطباعة وفهم المطالبات المعقدة وكفاءة الموارد. يوفر حجمها الهائل الذي يصل إلى 8 مليار معلمة إمكانيات إنشاء صور بمستوى احترافي، مما يجعلها مناسبة بشكل خاص لاحتياجات إنشاء صور عالية الدقة. إنه مولد انتشاري متعدد الوسائط يستخدم ثلاثة مشفرات نصية ثابتة مدربة مسبقًا ويستخدم تنظيم QK لتحسين استقرار التدريب.
كيفية الركض
1. 在该项目右上角点击「克隆」,随后依次点击「下一步」即可完成:基本信息> 选择算力> 审核等步骤。最后点击「继续执行」即可在个人容器内开启本项目。
2. 等待容器资源分配完成后,可直接使用平台提供的 API 地址进行操作页面的访问(需要提前完成实名认证,此步无需打开工作空间)

3. 输入文本提示,点击 Run

4. 生成结果

المناقشة والتبادل
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [تبادل الدروس] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
