2달 전
ESRGAN: 향상된 초해상도 생성적 적대 네트워크
Xintao Wang; Ke Yu; Shixiang Wu; Jinjin Gu; Yihao Liu; Chao Dong; Chen Change Loy; Yu Qiao; Xiaoou Tang

초록
슈퍼 해상도 생성적 적대 네트워크(SRGAN, Super-Resolution Generative Adversarial Network)는 단일 이미지 슈퍼 해상도 과정에서 실제적인 텍스처를 생성할 수 있는 획기적인 연구입니다. 그러나 환영된 세부 정보와 함께 종종 불쾌한 아티팩트가 발생합니다. 시각적 품질을 더욱 개선하기 위해, 우리는 SRGAN의 세 가지 핵심 구성 요소 - 네트워크 구조, 적대 손실 함수, 그리고 지각 손실 함수를 철저히 연구하고 각각을 개선하여 강화된 SRGAN(ESRGAN, Enhanced SRGAN)을 도출하였습니다. 특히, 배치 정규화 없이 잔차-인-잔차 밀집 블록(Residual-in-Residual Dense Block, RRDB)을 기본 네트워크 구성 단위로 도입하였습니다. 또한 상대론적 GAN의 아이디어를 차용하여 판별자가 절대값 대신 상대적인 진짜성을 예측하도록 하였습니다. 마지막으로, 활성화 이전의 특징들을 사용하여 지각 손실 함수를 개선했으며, 이는 밝기 일관성과 텍스처 복원에 대해 더 강력한 감독을 제공할 수 있습니다. 이러한 개선 덕분에 제안된 ESRGAN은 SRGAN보다 더 실제적이고 자연스러운 텍스처를 갖춘 시각적으로 우수한 결과를 일관되게 달성하였으며, PIRM2018-SR 챌린지에서 1등을 차지하였습니다. 코드는 https://github.com/xinntao/ESRGAN 에서 확인할 수 있습니다.