2달 전

이진 확산 확률 모델

Kinakh, Vitaliy ; Voloshynovskiy, Slava
이진 확산 확률 모델
초록

우리는 이진 데이터 표현에 최적화된 새로운 생성 모델인 이진 확산 확률 모델(Binary Diffusion Probabilistic Model, BDPM)을 소개합니다. 노이즈 제거 확산 확률 모델(Denoising Diffusion Probabilistic Models, DDPMs)은 이미지 합성 및 복원과 같은 작업에서 뚜렷한 성공을 거두었지만, 전통적인 DDPM은 연속적인 데이터 표현과 평균 제곱 오차(Mean Squared Error, MSE) 손실을 사용하여 가우시안 노이즈 모델을 적용하는데, 이러한 방법이 이산 또는 이진 데이터 구조에는 최적이 아닐 수 있습니다. BDPM은 이를 해결하기 위해 이미지를 비트플레인(bitplane)으로 분해하고 XOR 기반의 노이즈 변환을 사용하며, 노이즈 제거 모델은 이진 크로스 엔트로피(binary cross-entropy) 손실을 통해 훈련됩니다. 이러한 접근 방식은 정밀한 노이즈 제어와 계산적으로 효율적인 추론을 가능하게 하며, 계산 비용을大幅降低并提高模型收敛速度。在图像恢复任务(如图像超分辨率、修复和盲图像恢复)中评估时,BDPM在FFHQ、CelebA和CelebA-HQ数据集上的表现优于现有最先进方法。值得注意的是,BDPM达到最佳结果所需的推理步骤比传统DDPM模型少,展示了其增强的推理效率。修正后的韩文翻译:우리는 이진 데이터 표현에 최적화된 새로운 생성 모델인 이진 확산 확률 모델(Binary Diffusion Probabilistic Model, BDPM)을 소개합니다. 노이즈 제거 확산 확률 모델(Denoising Diffusion Probabilistic Models, DDPMs)은 이미지 합성 및 복원과 같은 작업에서 뚜렷한 성공을 거두었지만, 전통적인 DDPM은 연속적인 데이터 표현과 평균 제곱 오차(Mean Squared Error, MSE) 손실을 사용하여 가우시안 노이즈 모델을 적용하는데, 이러한 방법이 이산 또는 이진 데이터 구조에는 최적이 아닐 수 있습니다. BDPM은 이를 해결하기 위해 이미지를 비트플레인(bitplane)으로 분해하고 XOR 기반의 노이즈 변환(XOR-based noise transformation)을 사용하며, 노이즈 제거 모델은 이진 크로스 엔트로피(binary cross-entropy) 손실을 통해 훈련됩니다. 이러한 접근 방식은 정밀한 노이즈 제어와 계산적으로 효율적인 추론(inference)를 가능하게 하며, 계산 비용을 크게 줄이고 모델 수렴성을 개선합니다. 이미지 복원 작업(예: 이미지 초해상도 증대(super-resolution), 인페인팅(inpainting), 맹복원(blind image restoration))에서 평가할 때 BDPM은 FFHQ, CelebA, CelebA-HQ 데이터셋에서 현존하는 최신 방법들을 능가하는 성능을 보입니다. 특히 BDPM은 최적 결과에 도달하기 위해 필요한 추론 단계가 전통적인 DDPM 모델보다 적어 추론 효율성이 향상됨을 입증하였습니다.

이진 확산 확률 모델 | 최신 연구 논문 | HyperAI초신경