17일 전

DeblurDiNAT: 미지의 도메인에서 뛰어난 일반화성과 시각적 정확도를 갖춘 컴팩트 모델

Hanzhou Liu, Binghan Li, Chengkai Liu, Mi Lu
DeblurDiNAT: 미지의 도메인에서 뛰어난 일반화성과 시각적 정확도를 갖춘 컴팩트 모델
초록

최근의 디블러링 네트워크는 흐려진 이미지로부터 명확한 이미지를 효과적으로 복원하고 있다. 그러나 이러한 모델들은 알 수 없는 도메인으로의 일반화에 어려움을 겪는다. 게다가, 이러한 모델들은 주로 PSNR 및 SSIM과 같은 왜곡 측정 지표에 집중하는 반면, 인간의 시각 인식과 일치하는 중요한 측정 지표는 간과하는 경향이 있다. 이러한 한계를 해결하기 위해 우리는 Dilated Neighborhood Attention 기반의 디블러링 트랜스포머인 DeblurDiNAT을 제안한다. 먼저, DeblurDiNAT은 교대적 확장 계수 파라다임을 도입하여 국소적이고 전역적인 흐림 패턴을 동시에 포착함으로써 일반화 능력과 인지적 명료성을 향상시킨다. 둘째, 국소적 크로스 채널 학습기(Cross-channel Learner)는 트랜스포머 블록이 인접 채널 간의 단거리 관계를 이해하는 데 기여한다. 또한, 단순하면서도 효과적인 설계를 가진 선형 피드포워드 네트워크를 제안한다. 마지막으로, 기존 방식의 대안으로 이중 단계 특징 병합 모듈을 도입하여 네트워크 레벨 간의 다중 해상도 시각 정보를 효율적으로 처리한다. 최신 기술 대비, 본 연구에서 제안하는 컴팩트한 DeblurDiNAT은 뛰어난 일반화 능력을 보이며, 모델 크기가 적절한 수준을 유지하면서도 인지적 성능 지표에서 뛰어난 성과를 달성하였다.

DeblurDiNAT: 미지의 도메인에서 뛰어난 일반화성과 시각적 정확도를 갖춘 컴팩트 모델 | 최신 연구 논문 | HyperAI초신경