Kolors 快手可图文生图大模型 Demo

Kolors 一个更懂中文的文生图大模型

模型介绍

Kolors 是快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本图像对的训练,Kolors 在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面比开源和闭源模型表现出显着优势。此外,Kolors 支持中文和英文输入,在理解和生成中文内容方面表现出强大的性能。生成效果比肩 Midjourney-v6 水平,支持长达 256 字符的文本输入。

运行方法

1. 克隆并运行容器

2. 待容器为「运行中」状态时,复制 API 地址到浏览器中打开

3. 打开链接后可以看到如下界面

4. 点击下方上传图片,并输入文本提示,点击 Generate Image 即可生成结果

也可以根据需要修改相关参数

  • Height:修改生成图像的高
  • Width:修改生成图像的宽
  • Inference Steps:生成图像时所采用的去噪步骤的数量,通常,使用默认的推理步数(例如 50 步)可以得到高质量的图像。如果需要快速预览生成效果,可以使用较小的步数;而如果追求最高质量的结果,则可以使用较大的步数
  • Guidance Scale:控制模型生成图像时对文本提示条件服从程度的超参数。数值较大时(例如大于 7),生成的图像可能会在视觉上更接近文本提示的描述,具有更高的质量和一致性。数值较小时(例如低于 7),生成的图像可能会展现出更多的多样性,模型在生成图像时对文本提示的依赖性降低,从而允许更多的创造性和变化。
  • Images per Prompt:修改模型生成图像的数量。

5. 生成结果

探讨交流

🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓