HyperAI超神经

InfiniteYou 高保真图像生成 Demo

效果示例

一、教程简介

InfiniteYou,简称 InfU 是由字节跳动智能创作团队于 2025 年推出的一款基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。它通过先进的技术,能够在生成图像的同时保持人物身份的一致性,解决了现有方法在身份相似度、文本-图像对齐和生成质量方面的不足。

作为该领域最早利用扩散 Transformer (DiTs) 的鲁棒框架之一,InfU 系统性地解决了现有方法的三大核心问题:身份相似度不足、图文对齐偏差以及生成质量与美学表现欠佳。其核心创新 InfuseNet 通过残差连接将身份特征注入 DiT 基模型,在保持生成能力的同时显著提升身份保真度。采用包含预训练和合成单人多样本 (SPMS) 数据监督微调 (SFT) 的多阶段训练策略,进一步优化了图文对齐性,改善生成质量并有效缓解人脸复制效应。大量实验表明,InfU 实现了最先进的性能表现,全面超越现有基线方法。其即插即用式设计更保证了与各类现有方法的兼容性,为学界提供了重要技术贡献。

本教程使用 InfiniteYou-FLUX v1.0 作为演示,算力资源采用 A6000 。

教程提供了 2 个模型版本:

InfiniteYou 版本模型版本训练使用的基础模型特性描述
InfiniteYou-FLUX v1.0aes_stage2FLUX.1-dev经过监督微调 (SFT) 的第二阶段模型,具有更优的图文对齐效果和美学表现
InfiniteYou-FLUX v1.0sim_stage1FLUX.1-dev监督微调前的第一阶段模型,提供更高的身份特征相似度

二、运行步骤

1. 启动容器后点击 API 地址即可进入 Web 界面

若不显示「模型」,这表示模型正在初始化,由于模型较大,请等待约 1-2 分钟后刷新页面。

2. 进入网页后,即可开始使用

❗️重要的使用技巧:

  • 模型版本:默认使用 aes_stage2 以获得更好的图文对齐和美学效果。如需更高的 ID 相似度,请尝试 sim_stage1
  • 实用超参数:通常无需过多调整。如有必要,可尝试稍大的 --infusenet_guidance_start(例如 0.1)(对 sim_stage1 尤其有效)。若效果仍不理想,再尝试稍小的 --infusenet_conditioning_scale(例如 0.9)。
  • 可选 LoRArealism(真实感)和 anti-blur(抗模糊)。勾选对应选框即可启用。这些是可选功能,未在论文中使用。
  • 性别提示:若生成性别不符合预期,请在文本提示中加入特定词汇,如「一位男性」、「一位女性」等。本项目鼓励使用包容且尊重的语言表达。

使用步骤

交流探讨

🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓