7일 전

단일 이미지 흐림 제거를 위한 비전 트랜스포머

Yuda Song, Zhuqing He, Hui Qian, Xin Du
단일 이미지 흐림 제거를 위한 비전 트랜스포머
초록

이미지 해저닝은 안개가 낀 이미지에서 잠재적인 안개 없는 이미지를 추정하는 대표적인 저수준 시각 작업이다. 최근 몇 년간 컨볼루션 신경망 기반 방법이 이미지 해저닝 분야를 지배해 왔다. 그러나 최근 고수준 시각 작업에서 돌파구를 이룬 비전 트랜스포머(Vision Transformer)는 이미지 해저닝 분야에 새로운 차원을 제공하지 못했다. 본 연구는 인기 있는 Swin Transformer를 기반으로 하여, 그 핵심 설계 요소 중 일부가 이미지 해저닝에 적합하지 않음을 발견하였다. 이를 해결하기 위해, 개선된 정규화 계층, 활성화 함수, 공간 정보 집약 방식 등을 포함한 다양한 개선을 도입한 DehazeFormer을 제안한다. 다양한 데이터셋에서 여러 변형 모델을 학습함으로써 본 모델의 효과성을 입증하였다. 특히, 가장 널리 사용되는 SOTS indoor 데이터셋에서, 본 연구의 소형 모델은 파라미터 수가 단 25%에 불과하고 연산 비용도 5%만으로도 FFA-Net을 능가한다. 본 연구에 따르면, 본 모델의 대형 버전은 SOTS indoor 데이터셋에서 PSNR가 40 dB를 초과하는 최초의 방법으로, 기존 최고 성능 방법들에 비해 극적으로 우수한 성능을 보였다. 또한, 매우 비균일한 안개를 제거할 수 있는 능력을 평가하기 위해 대규모 실재 원격 감지 해저닝 데이터셋을 수집하였다.

단일 이미지 흐림 제거를 위한 비전 트랜스포머 | 최신 연구 논문 | HyperAI초신경