Restormer: 효율적인 트랜스포머를 이용한 고해상도 이미지 복원

컨벌루션 신경망(CNNs)은 대규모 데이터에서 일반화 가능한 이미지 사전을 학습하는 데 우수한 성능을 보이기 때문에, 이러한 모델들은 이미지 복원 및 관련 작업에 광범위하게 적용되어 왔습니다. 최근에는 트랜스포머(Transformer)라는 또 다른 클래스의 신경 구조가 자연어 처리와 고차 시각 작업에서 상당한 성능 향상을 보여주었습니다. 트랜스포머 모델은 CNNs의 단점(즉, 제한된 수용 범위와 입력 내용에 대한 적응성 부족)을 완화하지만, 계산 복잡도는 공간 해상도에 따라 2차적으로 증가하므로 대부분의 고해상도 이미지를 포함하는 이미지 복원 작업에 적용하기 어려웠�습니다. 본 연구에서는 여러 가지 주요 설계를 통해 빌딩 블록(다중 헤드 주의 메커니즘과 피드 포워드 네트워크)을 개선하여 장거리 픽셀 상호작용을 포착할 수 있는 효율적인 트랜스포머 모델을 제안합니다. 이로써 여전히 큰 이미지에도 적용할 수 있습니다. 우리 모델은 '복원 트랜스포머'(Restoration Transformer, Restormer)로 명명되었으며, 이미지 비제거, 단일 이미지 움직임 블러 제거, 초점 이탈 블러 제거(단일 이미지 및 듀얼 픽셀 데이터), 그리고 이미지 노이즈 제거(가우시안 그레이스케일/컬러 노이즈 제거 및 실제 이미지 노이즈 제거) 등 여러 이미지 복원 작업에서 최고 수준의 결과를 달성하였습니다. 소스 코드와事前訓練된 모델들은 https://github.com/swz30/Restormer 에서 제공됩니다.注: "事前訓練된" 是日语词汇,正确的韩语翻译应该是 "사전 훈련된"。因此,修正后的最后一句为:소스 코드와 사전 훈련된 모델들은 https://github.com/swz30/Restormer 에서 제공됩니다.