
摘要
我们介绍了二进制扩散概率模型(Binary Diffusion Probabilistic Model, BDPM),这是一种针对二进制数据表示进行优化的新生成模型。尽管去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPMs)在图像合成和恢复等任务中取得了显著成功,但传统的DDPM依赖于连续数据表示和均方误差(Mean Squared Error, MSE)损失进行训练,应用高斯噪声模型可能并不适用于离散或二进制数据结构。BDPM通过将图像分解为位平面并采用基于XOR的噪声变换来解决这一问题,其去噪模型使用二元交叉熵损失进行训练。这种方法实现了精确的噪声控制和计算高效的推理,显著降低了计算成本并提高了模型收敛速度。在图像超分辨率、修复和盲图像恢复等图像恢复任务上,BDPM在FFHQ、CelebA和CelebA-HQ数据集上的表现优于现有最先进方法。值得注意的是,BDPM达到最优结果所需的推理步骤少于传统DDPM模型,展示了其增强的推理效率。