8일 전

이미지 복원을 위한 옴니 커널 네트워크

{Alois Knoll, Wenqi Ren, Yuning Cui}
초록

이미지 복원은 품질이 저하된 관측 이미지로부터 고품질 이미지를 재구성하는 것을 목표로 한다. 최근 Transformer 모델은 장거리 의존성 모델링 능력이 뛰어나 이미지 복원 작업에서 희망적인 성능을 달성하고 있다. 그러나 입력 크기에 따라 복잡도가 제곱적으로 증가하는 문제로 인해 실용적 응용에는 부적합하다는 한계가 있다. 본 논문에서는 다중 스케일 표현 학습을 강화함으로써 효율적인 컨볼루션 네트워크를 개발한다. 이를 위해 전역부터 국소까지의 특징 표현을 효율적으로 학습할 수 있는 옴니 커널 모듈을 제안한다. 이 모듈은 전역, 대규모, 국소 세 가지 브랜치로 구성된다. 특히 전역 브랜치는 이중 도메인 채널 주의 메커니즘과 주파수 게이팅 기반 구조를 통해 전역적인 시각적 필드를 달성한다. 또한, 다양한 형태의 깊이 지능형 컨볼루션과 비정상적으로 큰 커널 크기를 활용하여 다중 해상도의 수용 필드를 제공하는 대규모 브랜치를 설계하였다. 더불어 국소 정보는 점형 깊이 지능형 컨볼루션을 통해 보완한다. 마지막으로, 효율성을 높이기 위해 옴니 커널 모듈을 블록체인(버튼넥) 위치에 삽입함으로써 제안된 네트워크 OKNet을 구축하였다. 광범위한 실험 결과, OKNet은 이미지 제거(이미지 흐림 제거), 눈 오름 제거, 초점 왜곡 제거를 포함한 세 가지 대표적인 이미지 복원 작업에 대해 11개의 벤치마크 데이터셋에서 최고 수준의 성능을 달성하였다. 코드는 https://github.com/c-yn/OKNet 에서 공개되어 있다.

이미지 복원을 위한 옴니 커널 네트워크 | 최신 연구 논문 | HyperAI초신경