17일 전

다중 수용장역 네트워크를 이용한 세그멘테이션

Jianlong Yuan, Zelu Deng, Shu Wang, Zhenbo Luo
다중 수용장역 네트워크를 이용한 세그멘테이션
초록

시맨틱 세그멘테이션은 컴퓨터 비전 분야에서 핵심적인 과제 중 하나로, 이미지 내 각 픽셀에 카테고리 레이블을 할당하는 작업이다. 최근 상당한 진전이 있었음에도 불구하고, 기존의 대부분의 방법들은 여전히 두 가지 도전적인 문제에 직면해 있다. 첫째, 이미지 내 객체 및 스태프(Stuff)의 크기가 매우 다양할 수 있으므로, 완전 컨볼루션 네트워크(FCN)에 다중 스케일 특징을 통합할 필요가 있다. 둘째, 객체나 스태프의 경계 근처 또는 경계 상의 픽셀은 컨볼루션 네트워크의 내재적 약점으로 인해 분류하기 어려운 편이다. 이러한 문제 해결을 위해, 우리는 다중 수용장 영역 특징을 명시적으로 고려하는 새로운 다중 수용장 영역 모듈(Multi-Receptive Field Module, MRFM)을 제안한다. 또한 경계 분류의 정확도를 높이기 위해 경계 인식형 손실 함수(edge-aware loss)를 설계하였다. 이 두 가지 설계를 통해 제안하는 다중 수용장 영역 네트워크(Multi Receptive Field Network)는 두 가지 널리 사용되는 시맨틱 세그멘테이션 기준 데이터셋에서 새로운 최고 성능을 달성하였다. 구체적으로, Cityscapes 데이터셋에서 평균 IoU 83.0, Pascal VOC2012 데이터셋에서 평균 IoU 88.4를 기록하였다.