
摘要
本文研究了语义引导的场景生成任务。场景生成中的一个开放性挑战在于,小物体及局部细节纹理的生成困难,这一问题在现有的全局图像级生成方法中普遍存在。为解决该问题,本文提出在局部上下文中学习场景生成,并相应设计了一种以语义图作为引导的局部类别特定生成网络。该网络通过分别构建并训练专注于不同类别生成的子生成器,能够生成更丰富的场景细节。为进一步提升局部生成任务中类别特定特征表示的判别能力,本文还提出了一种新型分类模块。为融合全局图像级生成与局部类别特定生成的优势,本文设计了一种联合生成网络,其中嵌入了注意力融合模块与双判别器结构。在两个场景图像生成任务上的大量实验表明,所提模型展现出卓越的生成性能,在两项任务及具有挑战性的公开基准上均取得了显著优于现有方法的成果。相关源代码与训练好的模型已公开,地址为:https://github.com/Ha0Tang/LGGAN。