
최근 최첨단 의미 분할 기법들은 높은 성능을 달성하기 위해 고해상도 입력을 적용하는 경우가 많지만, 이는 큰 계산 부담을 초래하며 자원이 제한된 장치에서의 응용을 제한한다. 본 논문에서는 추가적인 계산 비용 없이 분할 정확도를 효과적으로 향상시킬 수 있는 간단하고 유연한 이중 스트림 프레임워크인 이중 슈퍼해상도 학습(Dual Super-Resolution Learning, DSRL)을 제안한다. 구체적으로 제안된 방법은 의미 분할 슈퍼해상도(Semantic Segmentation Super-Resolution, SSSR), 단일 이미지 슈퍼해상도(Single Image Super-Resolution, SISR), 및 특징 유사도(Feature Affinity, FA) 모듈의 세 가지 구성 요소로 이루어져 있으며, 저해상도 입력을 유지하면서도 고해상도 표현을 유지할 수 있으면서 동시에 모델의 계산 복잡도를 감소시킬 수 있다. 또한 다른 작업, 예를 들어 인간 포즈 추정 등에 쉽게 확장 가능하다. 이 간단하면서도 효과적인 방법은 강력한 표현력을 제공하며, 의미 분할과 인간 포즈 추정 모두에서 유망한 성능을 입증하고 있다. 특히 CityScapes 데이터셋에서의 의미 분할 작업에서는 유사한 FLOPs(연산량)를 유지하면서 mIoU가 2% 이상 향상되었으며, FLOPs를 70%로 줄였을 때도 성능을 유지할 수 있었다. 인간 포즈 추정에서는 동일한 FLOPs에서 mAP가 2% 이상 향상되었으며, FLOPs를 30% 감소시켜도 mAP 성능을 유지할 수 있었다. 코드 및 모델은 https://github.com/wanglixilinx/DSRL 에서 제공된다.