التاريخ

منذ عام واحد

الحجم

754.42 MB

الوسوم

نشر Stable Diffusion 3.5 Large بنقرة واحدة

مقدمة البرنامج التعليمي

该教程仅需 RTX 4090 即可启动。

Stable Diffusion 3.5 عبارة عن سلسلة من نماذج توليد الصور المتقدمة بالذكاء الاصطناعي التي أطلقتها شركة Stability AI في عام 2024، وهو ما يمثل تقدمًا كبيرًا في نماذج توليد الصور بالذكاء الاصطناعي مفتوحة المصدر. تتضمن السلسلة عدة إصدارات من النموذج لتلبية احتياجات مجموعات المستخدمين المختلفة، بما في ذلك الباحثين العلميين، والهواة، والشركات الناشئة، والمؤسسات.

يوفر Stable Diffusion 3.5 ثلاثة أحجام من النماذج: كبير، وتوربو كبير، ومتوسط. يحتوي الطراز الكبير على 8 مليار معلمة وهو مناسب لسيناريوهات التطبيقات الاحترافية بدقة ميجا بكسل؛ Large Turbo هو إصدار مبسط من Large الذي يمكنه إنشاء صور عالية الجودة بسرعة؛ يحتوي النموذج المتوسط على 2.5 مليار معلمة وهو مصمم للعمل على أجهزة مخصصة للمستهلك، مع تحقيق التوازن بين الجودة وسهولة التخصيص.

من الميزات البارزة الأخرى لنماذج سلسلة Stable Diffusion 3.5 هي إمكانية تخصيصها. عند تطوير هذه النماذج، ركزت شركة Stability AI بشكل خاص على أهمية التعديلات الشخصية، مما يسمح للمستخدمين بضبط النماذج بسهولة وفقًا لاحتياجاتهم المحددة. لا توفر هذه المرونة للفنانين والمصممين مساحة إبداعية واسعة فحسب، بل توفر أيضًا للمطورين إمكانية إنشاء سير عمل مخصصة. وبالإضافة إلى ذلك، فإن التنوع والشمولية التي تظهرها هذه النماذج عند إنشاء الصور تشكل أيضًا أحد أهم النقاط البارزة. إنهم قادرون على إنشاء صور تمثل خلفيات وخصائص ثقافية مختلفة، مما يثري بشكل كبير سيناريوهات تطبيق توليد الصور بالذكاء الاصطناعي. من النمذجة ثلاثية الأبعاد إلى التصوير الفوتوغرافي، ومن الرسم إلى فن الخطوط، يمكن لـ Stable Diffusion 3.5 محاكاة أي نمط مرئي يمكن تخيله تقريبًا، مما يوفر للمستخدمين إمكانيات إبداعية غير محدودة.

يستخدم هذا البرنامج التعليمي نموذج Stable Diffusion 3.5 Large، وهو نموذج تحويل النص إلى صورة من خلال مولد الانتشار المتعدد الوسائط (MMDiT) والذي يتميز بتحسينات كبيرة في جودة الصورة والطباعة وفهم المطالبات المعقدة وكفاءة الموارد. يوفر حجمها الهائل الذي يصل إلى 8 مليار معلمة إمكانيات إنشاء صور بمستوى احترافي، مما يجعلها مناسبة بشكل خاص لاحتياجات إنشاء صور عالية الدقة. إنه مولد انتشاري متعدد الوسائط يستخدم ثلاثة مشفرات نصية ثابتة مدربة مسبقًا ويستخدم تنظيم QK لتحسين استقرار التدريب.

كيفية الركض

1. 在该项目右上角点击「克隆」，随后依次点击「下一步」即可完成：基本信息> 选择算力> 审核等步骤。最后点击「继续执行」即可在个人容器内开启本项目。

2. 等待容器资源分配完成后，可直接使用平台提供的 API 地址进行操作页面的访问（需要提前完成实名认证，此步无需打开工作空间）

3. 输入文本提示，点击 Run

4. 生成结果

المناقشة والتبادل

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [تبادل الدروس] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

تم المساهمة في هذا الدفتر من قبل مستخدمي المجتمع وهو مخصص لأغراض تعليمية وإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

تشغيل هذا Notebook

التاريخ

منذ عام واحد

الحجم

754.42 MB

الوسوم

توليد الصور

نشر Stable Diffusion 3.5 Large بنقرة واحدة

مقدمة البرنامج التعليمي

该教程仅需 RTX 4090 即可启动。

كيفية الركض

1. 在该项目右上角点击「克隆」，随后依次点击「下一步」即可完成：基本信息> 选择算力> 审核等步骤。最后点击「继续执行」即可在个人容器内开启本项目。

2. 等待容器资源分配完成后，可直接使用平台提供的 API 地址进行操作页面的访问（需要提前完成实名认证，此步无需打开工作空间）

3. 输入文本提示，点击 Run

4. 生成结果

المناقشة والتبادل

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

منذ 2 أشهر

تينسنت هونيوان فيديو-فولي

منذ شهر واحد

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

منذ 2 أشهر

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

منذ 2 أشهر

نشر نموذج SmolLM3-3B بنقرة واحدة

منذ 3 أشهر

نيموترون - بث الكلام - التعرف التلقائي على الكلام

منذ 22 أيام

عرض توضيحي ثلاثي الأبعاد لـ TRELLIS.2

منذ 20 أيام

SAM3: نموذج التجزئة المرئية

منذ 2 أشهر

شاندرا: تقنية التعرف الضوئي على الأحرف عالية الدقة للوثائق

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

عرض توضيحي لإنشاء صور كبيرة باستخدام Stable-Diffusion-3.5

نشر Stable Diffusion 3.5 Large بنقرة واحدة

مقدمة البرنامج التعليمي

كيفية الركض

المناقشة والتبادل

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

عرض توضيحي لإنشاء صور كبيرة باستخدام Stable-Diffusion-3.5

نشر Stable Diffusion 3.5 Large بنقرة واحدة

مقدمة البرنامج التعليمي

كيفية الركض

المناقشة والتبادل

ذات صلة دفاتر تفاعلية

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

تينسنت هونيوان فيديو-فولي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

نشر نموذج SmolLM3-3B بنقرة واحدة

نيموترون - بث الكلام - التعرف التلقائي على الكلام

عرض توضيحي ثلاثي الأبعاد لـ TRELLIS.2

SAM3: نموذج التجزئة المرئية

شاندرا: تقنية التعرف الضوئي على الأحرف عالية الدقة للوثائق

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

عرض توضيحي لإنشاء صور كبيرة باستخدام Stable-Diffusion-3.5

نشر Stable Diffusion 3.5 Large بنقرة واحدة

مقدمة البرنامج التعليمي

كيفية الركض

المناقشة والتبادل

ذات صلة دفاتر تفاعلية

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

تينسنت هونيوان فيديو-فولي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

نشر نموذج SmolLM3-3B بنقرة واحدة

نيموترون - بث الكلام - التعرف التلقائي على الكلام

عرض توضيحي ثلاثي الأبعاد لـ TRELLIS.2

SAM3: نموذج التجزئة المرئية

شاندرا: تقنية التعرف الضوئي على الأحرف عالية الدقة للوثائق

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة دفاتر تفاعلية

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

تينسنت هونيوان فيديو-فولي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

نشر نموذج SmolLM3-3B بنقرة واحدة

نيموترون - بث الكلام - التعرف التلقائي على الكلام

عرض توضيحي ثلاثي الأبعاد لـ TRELLIS.2

SAM3: نموذج التجزئة المرئية

شاندرا: تقنية التعرف الضوئي على الأحرف عالية الدقة للوثائق

ذات صلة دفاتر تفاعلية

Z-Image-Turbo: نموذج عالي الكفاءة لتوليد الصور بستة معلمات

تينسنت هونيوان فيديو-فولي

يقوم برنامج F5-E2 TTS باستنساخ أي صوت في 3 ثوانٍ فقط

SoulX-Podcast: توليد كلام نصي طويل بجودة البودكاست للعديد من اللهجات.

نشر نموذج SmolLM3-3B بنقرة واحدة

نيموترون - بث الكلام - التعرف التلقائي على الكلام

عرض توضيحي ثلاثي الأبعاد لـ TRELLIS.2

SAM3: نموذج التجزئة المرئية

شاندرا: تقنية التعرف الضوئي على الأحرف عالية الدقة للوثائق