17일 전
CascadePSP: 글로벌 및 로컬 정교화를 통한 클래스 무관성 및 매우 고해상도 세그멘테이션 접근
Ho Kei Cheng, Jihoon Chung, Yu-Wing Tai, Chi-Keung Tang

초록
최신의 의미론적 세그멘테이션 기법들은 거의 모든 경우에서 고정된 해상도 범위 내의 이미지에만 훈련되어 왔다. 이러한 기법들은 매우 고해상도 이미지에 대해 정확하지 않으며, 저해상도 세그멘테이션 결과를 이중선형 보간( bicubic upsampling )을 통해 확대할 경우 객체 경계 근처의 고해상도 세부 정보를 충분히 포착하지 못하기 때문이다. 본 논문에서는 고해상도 훈련 데이터를 전혀 사용하지 않고도 고해상도 세그멘테이션 문제를 해결할 수 있는 새로운 접근법을 제안한다. 핵심 아이디어는 로컬 경계를 가능한 한 항상 정교화하고 보정하는 CascadePSP 네트워크이다. 비록 본 네트워크는 저해상도 세그멘테이션 데이터로 훈련되었지만, 4K를 넘는 매우 고해상도 이미지에 대해서도 적용 가능하다. 다양한 데이터셋을 대상으로 정량적 및 정성적 실험을 수행하여, 제안하는 새로운 정교화 모듈을 통해 추가적인 미세조정(finetuning) 없이도 픽셀 수준의 정확한 세그멘테이션 경계를 복원할 수 있음을 보여주었다. 따라서 본 방법은 클래스에 종속되지 않는(class-agnostic) 특성을 지닌다. 마지막으로, 본 모델이 다중 클래스 세그멘테이션 환경에서 장면 해석(scene parsing)에 어떻게 적용될 수 있는지에 대해 실험적으로 입증하였다.