17일 전

WaveMixSR-V2: 더 높은 효율성을 통한 초해상도 향상

Pranav Jeevan, Neeraj Nixon, Amit Sethi
WaveMixSR-V2: 더 높은 효율성을 통한 초해상도 향상
초록

최근 단일 이미지 초해상도 증강 기술은 주로 토큰 믹서(token mixer) 및 트랜스포머 아키텍처에 의해 주도되어 왔다. WaveMixSR는 2차원 이산 웨이블릿 변환을 활용하여 공간적 토큰 믹싱을 수행하는 WaveMix 아키텍처를 도입하여, 놀라운 자원 효율성과 함께 초해상도 작업에서 뛰어난 성능을 달성하였다. 본 연구에서는 (1) 기존의 전치 컨볼루션 층을 픽셀 셔플(pixle shuffle) 연산으로 대체하고, (2) 더 높은 해상도 작업(4배 증강)을 위한 다단계 설계(multistage design)를 도입함으로써 WaveMixSR 아키텍처의 개선된 버전인 WaveMixSR-V2를 제안한다. 실험 결과, 제안된 모델인 WaveMixSR-V2는 여러 초해상도 작업에서 기존 아키텍처를 능가하며, BSD100 데이터셋에서 최고 수준의 성능을 기록하였다. 또한 더 적은 자원 소비, 높은 파라미터 효율성, 낮은 지연 시간(latency) 및 높은 처리량(throughput)을 동시에 달성하였다. 본 연구의 코드는 https://github.com/pranavphoenix/WaveMixSR 에서 공개되어 있다.

WaveMixSR-V2: 더 높은 효율성을 통한 초해상도 향상 | 최신 연구 논문 | HyperAI초신경