教程简介

该教程仅需 RTX 4090 即可启动。

Stable Diffusion 3.5 是由 Stability AI 于 2024 年推出的一系列先进的 AI 图像生成模型，它代表了开源 AI 文生图模型的重大进步。这个系列包括了多个版本的模型，以满足不同用户群体的需求，包括科学研究人员、爱好者、初创公司和企业。

Stable Diffusion 3.5 提供了 Large 、 Large Turbo 和 Medium 三种规模的模型。 Large 模型拥有 80 亿参数，适合百万像素分辨率的专业应用场景；Large Turbo 是 Large 的精简版，能够快速生成高质量图像；Medium 模型则拥有 25 亿参数，设计用于在消费级硬件上运行，平衡了质量和定制易用性。

Stable Diffusion 3.5 系列模型的另一个显著特点是它们的可定制性。 Stability AI 在开发这些模型时，特别强调了个性化调整的重要性，使得用户可以根据自己的具体需求，轻松地对模型进行微调。这种灵活性不仅为艺术家和设计师提供了广阔的创作空间，也为开发者提供了构建定制化工作流程的可能性。此外，这些模型在生成图像时展现出的多样性和包容性，也是其一大亮点。它们能够生成代表不同文化背景和特征的图像，极大地丰富了 AI 图像生成的应用场景。从三维建模到摄影，从绘画到线条艺术，Stable Diffusion 3.5 能够模拟几乎任何可以想象到的视觉风格，为用户提供了无限的创意实现可能。

该教程使用的是 Stable Diffusion 3.5 Large 模型，是一个多模态扩散生成器 (MMDiT) 文本生成图像模型，其特点是图像质量、排版、复杂提示理解和资源效率的显著提升，其 80 亿参数的庞大规模，提供了专业级别的图像生成能力，特别适合高分辨率的图像生成需求。它是一个多模态扩散生成器，使用三个预训练的固定文本编码器，并通过 QK 正则化来提高训练的稳定性。

运行方法

1. 在该项目右上角点击「克隆」，随后依次点击「下一步」即可完成：基本信息> 选择算力> 审核等步骤。最后点击「继续执行」即可在个人容器内开启本项目。 2. 等待容器资源分配完成后，可直接使用平台提供的 API 地址进行操作页面的访问（需要提前完成实名认证，此步无需打开工作空间）

3. 输入文本提示，点击 Run

4. 生成结果

HyperAI

运行此教程

日期

1 年前

标签

图像生成

一键部署 Stable Diffusion 3.5 Large

教程简介

该教程仅需 RTX 4090 即可启动。

运行方法

1. 在该项目右上角点击「克隆」，随后依次点击「下一步」即可完成：基本信息> 选择算力> 审核等步骤。最后点击「继续执行」即可在个人容器内开启本项目。

2. 等待容器资源分配完成后，可直接使用平台提供的 API 地址进行操作页面的访问（需要提前完成实名认证，此步无需打开工作空间）

3. 输入文本提示，点击 Run

4. 生成结果

探讨交流

🖌️ 如果大家看到优质项目，欢迎后台留言推荐！另外，我们还建立了教程交流群，欢迎小伙伴们扫码备注【教程交流】入群探讨各类技术问题、分享应用效果↓

本笔记本由社区用户贡献,仅用于教育和信息传播目的。如果任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Command Palette

Stable-Diffusion-3.5-Large 图像生成 Demo

一键部署 Stable Diffusion 3.5 Large

教程简介

运行方法

探讨交流

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Stable-Diffusion-3.5-Large 图像生成 Demo

一键部署 Stable Diffusion 3.5 Large

教程简介

运行方法

探讨交流

相关笔记本

MarkItDown 微软开源的文档转换工具

Chandra：高精度文档 OCR

Depth-Anything-3：从任何视角恢复视觉空间

MOSS：文本到口语对话生成

HunyuanOCR：腾讯混元端到端 OCR

SoulX-Podcast 面向多方言的播客级长文本语音生成

一键部署 Qwen-Image-Lightning

GLM-ASR-Nano 智谱语音识别

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

JarvisArt-Preview 智能照片修饰代理

腾讯混元 HunyuanVideo-Foley

Stable-Diffusion 在线教程-RTX5090

Long-VITA：百万 Token 多模态理解 Demo

Fara-7B：高效的网页智能体模型

Nemotron-Speech-Streaming-ASR：自动语音识别 Demo

TRELLIS.2 3D 生成 Demo

DiagGym 诊断智能体

Qwen3-TTS：高质量可控多语言语音合成 Demo

VibeVoice-ASR：多功能端到端语音识别 Demo

ACE-Step 1.5：音乐生成 Demo

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Stable-Diffusion-3.5-Large 图像生成 Demo

一键部署 Stable Diffusion 3.5 Large

教程简介

运行方法

探讨交流

相关笔记本

MarkItDown 微软开源的文档转换工具

Chandra：高精度文档 OCR

Depth-Anything-3：从任何视角恢复视觉空间

MOSS：文本到口语对话生成

HunyuanOCR：腾讯混元端到端 OCR

SoulX-Podcast 面向多方言的播客级长文本语音生成

一键部署 Qwen-Image-Lightning

GLM-ASR-Nano 智谱语音识别

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

JarvisArt-Preview 智能照片修饰代理

腾讯混元 HunyuanVideo-Foley

Stable-Diffusion 在线教程-RTX5090

Long-VITA：百万 Token 多模态理解 Demo

Fara-7B：高效的网页智能体模型

Nemotron-Speech-Streaming-ASR：自动语音识别 Demo

TRELLIS.2 3D 生成 Demo

DiagGym 诊断智能体

Qwen3-TTS：高质量可控多语言语音合成 Demo

VibeVoice-ASR：多功能端到端语音识别 Demo

ACE-Step 1.5：音乐生成 Demo

用 AI 构建 AI

HyperAI Newsletters

相关笔记本

MarkItDown 微软开源的文档转换工具

Chandra：高精度文档 OCR

Depth-Anything-3：从任何视角恢复视觉空间

MOSS：文本到口语对话生成

HunyuanOCR：腾讯混元端到端 OCR

SoulX-Podcast 面向多方言的播客级长文本语音生成

一键部署 Qwen-Image-Lightning

GLM-ASR-Nano 智谱语音识别

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

JarvisArt-Preview 智能照片修饰代理

腾讯混元 HunyuanVideo-Foley

Stable-Diffusion 在线教程-RTX5090

Long-VITA：百万 Token 多模态理解 Demo