
摘要
大多数条件生成任务期望在给定单一条件上下文的情况下产生多样化的输出。然而,条件生成对抗网络(cGANs)通常过于关注先验条件信息,而忽略了输入噪声向量,后者对输出变化起着重要作用。近期尝试解决cGANs模式塌陷问题的方法通常是特定于任务且计算成本高昂的。在这项工作中,我们提出了一种简单而有效的正则化项来应对cGANs的模式塌陷问题。所提出的方法显式地最大化了生成图像相对于相应潜在代码的距离比,从而鼓励生成器在训练过程中探索更多的次要模式。这种模式寻求正则化项可以轻松应用于各种条件生成任务,而不会增加训练开销或修改原始网络结构。我们在三个条件图像合成任务上验证了所提出的算法,包括类别生成、图像到图像翻译和文本到图像合成,并使用不同的基线模型进行了测试。定性和定量结果均表明,所提出的正则化方法在提高多样性的同时不会损失质量的有效性。