Command Palette

Search for a command to run...

19 天前

UltraHR-100K:基于大规模高质量数据集增强UHR图像合成

Chen Zhao En Ci Yunzhe Xu Tiehan Fan Shanyan Guan Yanhao Ge Jian Yang Ying Tai

UltraHR-100K:基于大规模高质量数据集增强UHR图像合成

摘要

超高清(Ultra-High-Resolution, UHR)文本到图像(Text-to-Image, T2I)生成技术已取得显著进展。然而,仍面临两个关键挑战:其一,缺乏大规模、高质量的UHR T2I数据集;其二,在UHR场景下对细粒度细节合成的定制化训练策略被普遍忽视。为应对第一个挑战,我们提出UltraHR-100K,一个包含10万张超高清图像的高质量数据集,每张图像均配有丰富且精准的描述文本,涵盖多样化的内容主题,并具备出色的视觉保真度。所有图像分辨率均超过3K,且在构建过程中严格依据细节丰富度、内容复杂度和美学质量进行筛选与优化。为应对第二个挑战,我们提出一种频率感知的后训练方法,用于增强T2I扩散模型在生成细粒度细节方面的能力。具体而言,我们设计了:(i)面向细节的采样时间步策略(Detail-Oriented Timestep Sampling, DOTS),通过聚焦于对细节恢复至关重要的去噪阶段,提升模型对细微结构的学习能力;(ii)软权重频率正则化(Soft-Weighting Frequency Regularization, SWFR),利用离散傅里叶变换(Discrete Fourier Transform, DFT)对频域成分施加软约束,有效促进高频细节的保留。在我们提出的UltraHR-eval4K评估基准上的大量实验表明,所提方法显著提升了UHR图像生成在细粒度细节表现与整体视觉保真度方面的性能。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
UltraHR-100K:基于大规模高质量数据集增强UHR图像合成 | 论文 | HyperAI超神经