17일 전

연속적 초해상도를 위한 음성적 확산 모델

Sicheng Gao, Xuhui Liu, Bohan Zeng, Sheng Xu, Yanjing Li, Xiaoyan Luo, Jianzhuang Liu, Xiantong Zhen, Baochang Zhang
연속적 초해상도를 위한 음성적 확산 모델
초록

이미지 슈퍼리졸루션(SR)은 광범위한 응용 분야로 인해 점점 더 많은 주목을 받고 있다. 그러나 기존의 SR 기법들은 일반적으로 과도한 부드러움과 아티팩트 문제를 겪으며, 대부분 고정된 확대 비율에만 대응한다. 본 논문에서는 고해상도 연속적 이미지 슈퍼리졸루션을 위한 은닉 확산 모델(Explicit Diffusion Model, IDM)을 제안한다. IDM은 종합적인 엔드 투 엔드 프레임워크 내에서 은닉 신경 표현(implicit neural representation)과 노이즈 제거 확산 모델(denoising diffusion model)을 통합하여, 복원 과정에서 연속적인 해상도 표현을 학습하도록 설계되었다. 또한, 해상도를 조절할 수 있는 조건부 메커니즘을 도입하였으며, 이는 저해상도(LR) 조건부 네트워크와 확대 요소(scaling factor)로 구성된다. 확대 요소는 출력 해상도를 조절함과 동시에 최종 출력에서 저해상도 정보와 생성된 특징 간의 비율을 조절함으로써, 모델이 연속적인 해상도 요구 사항에 유연하게 대응할 수 있도록 한다. 광범위한 실험을 통해 본 IDM의 효과성을 검증하였으며, 기존 기법들에 비해 뛰어난 성능을 입증하였다.

연속적 초해상도를 위한 음성적 확산 모델 | 최신 연구 논문 | HyperAI초신경