
초록
기존 이미지-이미지 변환(I2IT) 방법들은 고해상도 특성 맵의 합성곱에 따른 큰 계산 부담으로 인해 저해상도 이미지에 제한되거나 추론 시간이 길어지는 문제가 있습니다. 본 논문에서는 폐형 라플라시안 피라미드 분해 및 재구성을 기반으로 고해상도 광학적 I2IT 작업을 가속화하는 데 초점을 맞추고 있습니다. 구체적으로, 조명 및 색상 조작과 같은 속성 변환은 저주파 성분과 더 관련이 있으며, 콘텐츠 세부 사항은 고주파 성분에서 적응적으로 정교하게 수정될 수 있음을 밝혔습니다. 이에 따라, 우리는 저주파 성분을 해상도를 낮춘 상태로 변환하기 위한 경량 네트워크와 고주파 성분을 효율적으로 정교하게 수정하기 위한 단계적 마스킹 전략을 설계하여 이 두 작업을 동시에 수행할 수 있는 라플라시안 피라미드 변환 네트워크(LPTN)를 제안합니다. 우리의 모델은 고해상도 특성 맵 처리에 소모되는 대부분의 무거운 계산을 피하면서 이미지 세부 사항을 충실하게 보존합니다. 다양한 작업에 대한 광범위한 실험 결과는 제안된 방법이 일반적인 GPU 하나를 사용하여 4K 이미지를 실시간으로 변환할 수 있으며, 기존 방법들과 유사한 변환 성능을 달성함을 보여줍니다. 데이터셋과 코드는 다음과 같이 제공됩니다: https://github.com/csjliang/LPTN.