
초록
의미 분할(semantic segmentation) 주제는 합성곱 신경망(CNNs)이 학습한 강력한 특징들 덕분에 상당한 진전을 이룩하였습니다. 현재 의미 분할에서 선두를 달리는 접근 방식들은 마스킹된 이미지 영역에서 CNN 특징을 추출하여 형태 정보를 활용합니다. 이러한 전략은 이미지에 인위적인 경계를 도입하여 추출된 특징의 품질에 영향을 미칠 수 있습니다. 또한, 원시 이미지 영역에서의 연산은 단일 이미지에 대해 수천 개의 네트워크를 계산해야 하므로 시간이 많이 소요됩니다. 본 논문에서는 합성곱 특징을 마스킹하여 형태 정보를 활용하는 방법을 제안합니다. 제안된 세그먼트(예: 슈퍼픽셀)는 합성곱 특징 맵 위에 마스크로 처리됩니다. 세그먼트의 CNN 특징은 이러한 맵에서 직접 마스킹되어 인식을 위한 분류기 훈련에 사용됩니다. 또한, 객체와 "스터프"(예: 잔디, 하늘, 물)를 동일한 프레임워크 내에서 처리하기 위한 통합 방법도 제안합니다. 본 연구는 PASCAL VOC 및 새로운 PASCAL-CONTEXT 벤치마크에서 최신 기술 결과를 보여주며, 뛰어난 계산 속도를 제공합니다.